联合实验室


智能文档模型(DocumentAI)成果介绍


滴普科技携手南科大联合团队,研发DocumentAI 采用高度先进的混合专家模型架构(MoE),基于“分而治之”的策略,将复杂的文档解析问题细化为若干子问题,由独立高效的专家模型分别承担,实现精准高效的文档信息处理与提取。


技术亮点


混合专家模型架构,采用MoE模型架构,有效整合多个专家模型,为复杂问题提供专业化解决方案。


视觉模型应用:利用视觉模型,深度解析和提取文档结构,表格内容,以及公式信息,实现对文档的全方位理解。

语言模型整合:通过先进的大语言模型抽取文档的大纲信息,提高文档信息的层次化管理和可访问性。

结构化信息提取:通过多模型混合应用,达到高效精准的结构化信息提取,为后续处理提供坚实基础。


应用领域与价值


DocumentAI的研发,在提取PDF或图片中的表格、文字、公式等信息方面表现卓越。该系统针对设计、制造等多个行业的业务场景进行了优化,显著提升了信息提取的准确率。