联合实验室


「Data+AI实验室」首期成果发布


        2024年1月10日,北京滴普科技有限公司和南方科技大学统计数科系联合成立了“DATA+AI”数据智能实验室,在短短的一年时间内实现了三大突破:
        1.打造全球首个中文大模型安全评测体系
        2.破解建筑行业知识检索效率难题
        3.突破企业级数据智能应用落地瓶颈


成果一、中文智能内容风控模型(ChineseSafe)

随着大语言模型(LLMs)的迅速发展,其内容安全能力日益受到关注。ChineseSafe 项目由滴普科技携手南科大联合团队研发,致力于推动中文语境下的大模型内容安全能力评估与提升。项目构建了涵盖十个维度的内容安全评测基准数据集,并评估了39个主流大语言模型的违规内容识别能力。同时,研发了准确率高、适应性强的内容风控大模型和适用于低算力场景的小模型,为中文内容风控提供了高效、经济的解决方案。

技术亮点

多模型安全评测:评估了39个主流开源和闭源模型的内容识别能力,构建内容安全评测榜单,展示各模型的风控能力。

内容风控大模型:采用上下文适应性训练与在线预测策略,在精准性与召回率之间取得优异平衡。

轻量级风控小模型:适用于资源受限场景,推理时间缩短,仍保持高准确率和召回率。

应用领域与价值

ChineseSafe 项目在中文内容安全评估和风控领域具有广泛的应用价值。其构建的评测数据集覆盖政治敏感、违法犯罪、心理健康等10个高风险维度,能够真实反映中文互联网平台的内容审核需求。该数据集已在 HuggingFace 开源平台发布,链接为: https://huggingface.co/datasets/SUSTech/ChineseSafe,为科研机构、企业及政府监管部门提供了一个高质量、可复用的内容风控评估基准。



成果二、建筑行业智能问答系统

该项目旨在构建一个高效、准确的建筑行业智能问答系统。系统以专业建筑数据为基础,结合大语言模型(如 ChatGPT-4)与Retrieval-Augmented Generation (RAG) 技术,实现了对建筑行业专业问题的高质量问答支持。项目通过系统性优化问答数据构建流程与模型调优技术,显著提升了问答系统在实际应用中的准确性与响应效率。

技术亮点

高质量问答对构造:基于 ChatGPT-4 和 RAG 模型,结合主题生成模块自动生成多样化问题,并通过定制标准进行质量评估。

RAG 系统检索优化:集成 ElasticSearch 实时向量搜索与上下文相关性评估功能,从专业文档中提取关键信息,实现高精度检索

系统性能调优:使用 Rages Model Tuning Toolkit 调整超参数、学习率并进行多轮优化,显著提升模型在建筑行业任务中的表现。

应用领域与价值

该系统广泛适用于建筑设计、施工管理、法规咨询等专业领域,可为从业人员提供快速、精准的信息查询服务。其智能化、高效响应能力显著提升了建筑行业的工作效率与决策质量。



成果三、大模型微调与智能体应用

该项目围绕大语言模型(LLM)的微调与智能体应用展开,旨在提升数据智能体在自然语言数据查询任务中的理解与推理能力。团队设计了高效的数据合成策略与微调算法,构建了基于开源大模型的完整训练框架。通过指令微调、分布式训练与性能评估,项目实现了从数据生成到模型部署的全流程闭环,智能体在真实应用场景中的查询准确率由原来的不足 10% 提升至 89%,显著提高了其在行业定制化任务中的实用性和可靠性

技术亮点

高质量数据合成方案:引入 self-instruct、humpback、oss-instruct 等自动标注与筛选技术,提升合成数据的多样性与复杂度,减少对商用数据源的依赖。

指令微调训练框架:基于 Transformers 构建大模型微调系统,支持分布式训练、任务自适应与多任务评估,有效增强模型的理解与生成能力。

智能体性能优化:结合领域数据配比优化策略,提升模型在自然语言查询、常识推理和数学问题求解等多类任务中的泛化表现。

应用领域与价值

该项目成果适用于企业级数据查询平台、智能客服、财务报表分析、政府数据开放接口等场景,显著提升了智能系统在自然语言交互中的响应准确性与效率。通过对开源大模型的微调与集成,项目为企业提供了灵活、高性价比的智能体开发方案,降低了依赖闭源模型的成本和风险。