大数跨境
0
0

联合实验室系列成果介绍 | 内容安全大模型

联合实验室系列成果介绍 | 内容安全大模型 跨境数科
2025-12-17
2

数据流通安全合规治理联合实验室:构建AI时代安全治理体系

在数字经济高速发展的今天,数据流通的安全与合规已成为全球关注焦点。由上海临港新片区跨境数据科技有限公司与北京信工博特智能科技有限公司牵头组建的“数据流通安全合规治理联合实验室”,依托国家队级技术实力,聚焦大模型内生安全,为人工智能时代构建可靠的安全治理体系。

技术引领:AI安全领域的“国家队”

联合实验室整合跨境数科与博特智能核心技术团队,以及中科院信息内容安全国家工程研究中心顶尖专家资源,专注大模型内生安全研究。通过自研内加固技术,构建价值观严格对齐的安全大模型,确保生成内容符合《生成式人工智能服务管理暂行办法》及国标GB/T 45654—2025《生成式人工智能服务安全基本要求》。

实验室在大模型安全评测、意识形态安全加固、信息内容安全、可控可信内容生成、跨境数据安全等细分领域达国内领先水平,已自主研发妙笔AI写作平台、AI内容审核平台等标杆性AI产品,服务政务、金融、出版等行业。

核心突破:构建闭环式大模型安全加固体系

实验室围绕大模型安全构建闭环加固体系: 1. 自动构建带思维链的安全问答数据集,兼顾通用与专用知识库以保留模型能力; 2. 采用SFT(全量/LoRA微调)与RLHF强化模型安全问答能力; 3. 基于自动化安全对抗测试与能力评估实现持续优化。

已完成对DeepSeek-R1-Distill-Qwen-32B模型的安全加固,推出全量微调与LoRA微调版本——DeepSeek-R1-Distill-Qwen-Bot-32B。测试显示,加固后模型在516道安全测试题中实现100%合规回答(原模型出错19次),同时在MMLU和MATH-500测试中保持原有能力。

落地实践:从技术到场景的深度赋能

1. 妙笔AI写作平台

融合大数据、NLP与深度学习技术的AIGC公文写作平台,提供智能写作、校对、润色等功能,助力党政机关提升效率、降低写作门槛并保障内容安全。支持数据本地化与私有化部署,已升级为价值观对齐大模型。

2. AI内容审核平台

融合大模型与多领域纠错模型,具备敏感信息识别、语法纠错与意识形态检测能力,显著提升中文内容审核准确性与效率。满足新闻出版、政务、金融等领域“三审三校”需求,支持审核智能一体机部署,已完成价值观对齐大模型升级。

未来愿景:打造全球数据安全治理标杆

联合实验室将持续探索跨境数据流通、多模态内容安全等前沿方向,推动AI技术“用得好”与“管得住”的协同发展,为全球数字治理贡献中国方案。

跨境数科

支持建设“国际数据港”

促进安全可控、便捷高效的国际数据流通与合作

【声明】内容源于网络
0
0
跨境数科
1234
内容 263
粉丝 0
跨境数科 1234
总阅读2.4k
粉丝0
内容263