研究成果

联合实验室

「Data+AI实验室」首期成果发布

2024年1月10日，北京滴普科技有限公司和南方科技大学统计数科系联合成立了“DATA+AI”数据智能实验室，在短短的一年时间内实现了三大突破：
1.打造全球首个中文大模型安全评测体系
2.破解建筑行业知识检索效率难题
3.突破企业级数据智能应用落地瓶颈

成果一、中文智能内容风控模型（ChineseSafe）

随着大语言模型（LLMs）的迅速发展，其内容安全能力日益受到关注。ChineseSafe 项目由滴普科技携手南科大联合团队研发，致力于推动中文语境下的大模型内容安全能力评估与提升。项目构建了涵盖十个维度的内容安全评测基准数据集，并评估了39个主流大语言模型的违规内容识别能力。同时，研发了准确率高、适应性强的内容风控大模型和适用于低算力场景的小模型，为中文内容风控提供了高效、经济的解决方案。

技术亮点

多模型安全评测：评估了39个主流开源和闭源模型的内容识别能力，构建内容安全评测榜单，展示各模型的风控能力。

内容风控大模型：采用上下文适应性训练与在线预测策略，在精准性与召回率之间取得优异平衡。

轻量级风控小模型：适用于资源受限场景，推理时间缩短，仍保持高准确率和召回率。

应用领域与价值

ChineseSafe 项目在中文内容安全评估和风控领域具有广泛的应用价值。其构建的评测数据集覆盖政治敏感、违法犯罪、心理健康等10个高风险维度，能够真实反映中文互联网平台的内容审核需求。该数据集已在 HuggingFace 开源平台发布，链接为： https://huggingface.co/datasets/SUSTech/ChineseSafe，为科研机构、企业及政府监管部门提供了一个高质量、可复用的内容风控评估基准。

成果二、建筑行业智能问答系统

该项目旨在构建一个高效、准确的建筑行业智能问答系统。系统以专业建筑数据为基础，结合大语言模型（如 ChatGPT-4）与Retrieval-Augmented Generation (RAG) 技术，实现了对建筑行业专业问题的高质量问答支持。项目通过系统性优化问答数据构建流程与模型调优技术，显著提升了问答系统在实际应用中的准确性与响应效率。

技术亮点

高质量问答对构造：基于 ChatGPT-4 和 RAG 模型，结合主题生成模块自动生成多样化问题，并通过定制标准进行质量评估。

RAG 系统检索优化：集成 ElasticSearch 实时向量搜索与上下文相关性评估功能，从专业文档中提取关键信息，实现高精度检索

系统性能调优：使用 Rages Model Tuning Toolkit 调整超参数、学习率并进行多轮优化，显著提升模型在建筑行业任务中的表现。

应用领域与价值

该系统广泛适用于建筑设计、施工管理、法规咨询等专业领域，可为从业人员提供快速、精准的信息查询服务。其智能化、高效响应能力显著提升了建筑行业的工作效率与决策质量。

成果三、大模型微调与智能体应用

该项目围绕大语言模型（LLM）的微调与智能体应用展开，旨在提升数据智能体在自然语言数据查询任务中的理解与推理能力。团队设计了高效的数据合成策略与微调算法，构建了基于开源大模型的完整训练框架。通过指令微调、分布式训练与性能评估，项目实现了从数据生成到模型部署的全流程闭环，智能体在真实应用场景中的查询准确率由原来的不足 10% 提升至 89%，显著提高了其在行业定制化任务中的实用性和可靠性

技术亮点

高质量数据合成方案：引入 self-instruct、humpback、oss-instruct 等自动标注与筛选技术，提升合成数据的多样性与复杂度，减少对商用数据源的依赖。

指令微调训练框架：基于 Transformers 构建大模型微调系统，支持分布式训练、任务自适应与多任务评估，有效增强模型的理解与生成能力。

智能体性能优化：结合领域数据配比优化策略，提升模型在自然语言查询、常识推理和数学问题求解等多类任务中的泛化表现。

应用领域与价值

该项目成果适用于企业级数据查询平台、智能客服、财务报表分析、政府数据开放接口等场景，显著提升了智能系统在自然语言交互中的响应准确性与效率。通过对开源大模型的微调与集成，项目为企业提供了灵活、高性价比的智能体开发方案，降低了依赖闭源模型的成本和风险。