大数跨境

六位一体!国家数据局发布高质量数据集建设方案

六位一体!国家数据局发布高质量数据集建设方案 Ai全域数字化圈
2026-04-15
28
导读:数字菁英网


——破解AI“数据饥渴”,国家级行动路线图出炉

人工智能正加速向千行百业渗透,而“高质量行业数据短缺”已成为制约大模型产业落地的核心瓶颈。为深入实施“人工智能+”行动,夯实AI发展的底层资源,近日,国家数据局牵头起草了《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》。

《方案》明确提出,到2028年底,我国将建成一批覆盖重点领域的高质量数据集,形成“场景牵引数据、数据驱动模型、模型赋能应用、应用创造价值”的“数据飞轮”。为实现这一目标,《方案》创造性地提出了“六位一体”的专项行动,全方位打通数据从供给到价值释放的全生命周期。

一、“六位一体”全链条构筑AI时代的超级燃料库

《方案》以全生命周期的视角,系统性部署了六大专项行动,旨在为人工智能发展提供充足、优质、安全的“燃料”。

第一位,做大供给侧, 聚焦金融、医疗、工业等重点行业以及具身智能、低空经济等前沿领域,拓宽数据供给渠道。顺应AI范式跃迁,大力推进多模态、真机交互以及合成数据等高质量数据集建设。

第二位,升级加工侧,推动数据标注从“劳动密集型”向“人机协同+专家深度参与”转变,重点生产逻辑推理、领域知识等高知识密度数据集,梯次布局数据标注创新试验区。

第三四一位,打通应用侧,打造集生产加工、流通利用于一体的“数据赋能工场”和“数据×智能体”示范工程,以模引数,以数赋模,形成良性闭环。

第五位,完善治理侧,建设“物理分散、逻辑集中”的国家数据集管理平台,落实数据“三权分置”,在守住安全底线的同时,探索更加包容灵活的治理框架。

第六位,繁荣商业侧,探索多元化商业模式和资产化创新路径,培育为高质量数据付费的市场共识,让数据要素真正变成核心资产。

二、聚焦产业痛点,有三大制度性创新

在《方案》的众多举措中,有三项制度性突破直击当前大模型企业和数据要素市场的核心痛点,吸引ResGov关注。

1. 创新商业模式,首提“Token(词元)”定价体系

过去数据交易多以“数据包”为单位,难以匹配大模型的算力逻辑。《方案》首次提出“探索以词元Token为基础的价值体系和新型交易模式”。这一首创性举措完全贴合了大模型按Token消耗计费的底层逻辑,为数据要素市场提供了一把极其精准的“定价标尺”,让高质量语料的买卖变得高度标准化和可量化。

2. 合规监管方面,探索AI训练期弹性监管体系

当前,大模型因使用网络公开数据进行训练而引发的版权纠纷在全球频发。《方案》提出“在保障合法权益的前提下,适度拓展版权合理使用边界,在人工智能训练阶段探索弹性监管体系”。给中国AI企业吃下一颗定心丸,缓解了模型厂商的版权侵权顾虑,打造了权责清晰、合规包容的创新环境。

3. 市场需求方面,政府国企带头买单

针对数据服务商面临的“好数据没人愿买单”的商业闭环难题,《方案》给出了一针强心剂,要发挥政府部门、国有企业的示范引领作用,“推动数据采买纳入预算编制,率先开展数据采购实践”。由国家队带头买单,注入真金白银的购买力,带动全社会形成“为高质量数据付费”的市场共识。

三、前瞻布局新产业,顺应AI技术范式跃迁

《方案》在科技产业政策上的前瞻性和专业度,人工智能正从对话向“多模态生成、决策执行、具身智能、物理交互”等新范式跃迁。

《方案》鼓励企业积极应用仿真模拟与合成技术扩大数据供给,加快建设物理交互、运动控制等真机交互数据集,积极布局“世界模型”等前沿方向。在数据标注领域,提出发展“专家型数据标注服务”,引导具有行业门槛的专兼职专家参与指令微调与强化学习标注,坚决遏制同质化、低水平重复建设。

《方案》行业从“搭框架、建制度”迈向了“深耕行业、服务AI、商业闭环”的全新阶段,随着“六位一体”行动的全面铺开,中国有望在这一轮全球人工智能竞逐中,依托坚实的高质量数据底座,真正迎来“智能经济”的新爆发。(文/ResGovov人工智能治理研究中心)

ResGov人工智能治理研究中心致力于以”责任为导向,伦理为底线,安全为基石“构建中国AI治理新范式。ResGov以‘R-E-S’为核心准则,提供负责任(Responsible)的价值引导、合伦理(Ethical)的合规框架以及强安全(Secure)的风险管控,三位一体的治理模型(Governance),帮助企业与机构在飞速发展的AI时代,拥抱技术创新,守住合规底线,共同践行具有中国特色的AI善治之道。

编辑:数字菁英网;投稿邮箱serv@digitalelite.cn

声明:刊载或转载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考,如有侵权或违反公众平台运营规范,请联系serv@digitalelite.cn删除。

数字菁英网为数字中国的设计者和建设者服务。数字菁英网下有Ai全域数字化圈、智能体Pro、首席数据官GOVCDO、人工智能GOVCDO、数据发展大讲堂GOVCDO等媒体矩阵,金英专栏、李正观点等专栏,服务数据要素、人工智能、全域数字化转型等新业态。

#人工智能 #数据要素 #高质量数据集 #数据治理 #AI大模型 #数据飞轮 #数据资产 #合成数据 #数据标注 #数据交易 #AI训练数据 #数据三权分置 #数据赋能 #智能经济 #数字化转型

【声明】内容源于网络
0
0
Ai全域数字化圈
Ai全域数字化是由数字菁英网推出的新媒体栏目。关注我,第一时间获得数据要素、人工智能、全域数字化转型资讯。
内容 4631
粉丝 0
Ai全域数字化圈 Ai全域数字化是由数字菁英网推出的新媒体栏目。关注我,第一时间获得数据要素、人工智能、全域数字化转型资讯。
总阅读8.7k
粉丝0
内容4.6k