智能文档模型(DocumentAI)成果介绍
滴普科技携手南科大联合团队,研发DocumentAI 采用高度先进的混合专家模型架构(MoE),基于“分而治之”的策略,将复杂的文档解析问题细化为若干子问题,由独立高效的专家模型分别承担,实现精准高效的文档信息处理与提取。
技术亮点
混合专家模型架构,采用MoE模型架构,有效整合多个专家模型,为复杂问题提供专业化解决方案。
视觉模型应用:利用视觉模型,深度解析和提取文档结构,表格内容,以及公式信息,实现对文档的全方位理解。
语言模型整合:通过先进的大语言模型抽取文档的大纲信息,提高文档信息的层次化管理和可访问性。
结构化信息提取:通过多模型混合应用,达到高效精准的结构化信息提取,为后续处理提供坚实基础。
应用领域与价值
DocumentAI的研发,在提取PDF或图片中的表格、文字、公式等信息方面表现卓越。该系统针对设计、制造等多个行业的业务场景进行了优化,显著提升了信息提取的准确率。