

联合实验室系列成果介绍 | 内容安全大模型

跨境数科

2025-12-17

数据流通安全合规治理联合实验室：构建AI时代安全治理体系

在数字经济高速发展的今天，数据流通的安全与合规已成为全球关注焦点。由上海临港新片区跨境数据科技有限公司与北京信工博特智能科技有限公司牵头组建的“数据流通安全合规治理联合实验室”，依托国家队级技术实力，聚焦大模型内生安全，为人工智能时代构建可靠的安全治理体系。

技术引领：AI安全领域的“国家队”

联合实验室整合跨境数科与博特智能核心技术团队，以及中科院信息内容安全国家工程研究中心顶尖专家资源，专注大模型内生安全研究。通过自研内加固技术，构建价值观严格对齐的安全大模型，确保生成内容符合《生成式人工智能服务管理暂行办法》及国标GB/T 45654—2025《生成式人工智能服务安全基本要求》。

实验室在大模型安全评测、意识形态安全加固、信息内容安全、可控可信内容生成、跨境数据安全等细分领域达国内领先水平，已自主研发妙笔AI写作平台、AI内容审核平台等标杆性AI产品，服务政务、金融、出版等行业。

核心突破：构建闭环式大模型安全加固体系

实验室围绕大模型安全构建闭环加固体系： 1. 自动构建带思维链的安全问答数据集，兼顾通用与专用知识库以保留模型能力； 2. 采用SFT（全量/LoRA微调）与RLHF强化模型安全问答能力； 3. 基于自动化安全对抗测试与能力评估实现持续优化。

已完成对DeepSeek-R1-Distill-Qwen-32B模型的安全加固，推出全量微调与LoRA微调版本——DeepSeek-R1-Distill-Qwen-Bot-32B。测试显示，加固后模型在516道安全测试题中实现100%合规回答（原模型出错19次），同时在MMLU和MATH-500测试中保持原有能力。