文/投稿:李正;刊载:数字菁英网
告别免费思维。刘烈宏在2025科创大会上详解AI-Ready数据标准,强调高质量数据集是数智创新的关键资源。
11月26日,2025科创大会在上海徐汇西岸国际会展中心开幕。
在这个聚焦未来科技风向的舞台上,国家数据局局长刘烈宏发表致辞,并向全行业发出了一个极其重要的信号。
在互联网免费思维盛行多年的背景下,国家数据局为何此时重提付费?这一呼吁背后,折射出中国数智化转型正在从数据大国向数据强国迈进的深层逻辑。
01. 重新定义好数据,什么是AI-Ready?
在过去,我们常通过量来衡量数据——PB级、EB级。但在AI大模型时代,质比量更关键。
很多企业面临的困境是,数据虽然多,但拿来训练模型全是噪点,也就是所谓的Garbage In, Garbage Out(垃圾进,垃圾出)。
致辞中,刘烈宏局长引入了业界前沿的AI-Ready(AI就绪度)概念,并首次官方拆解了AI就绪数据集的三个递进标准。
第一级,原料技术可行。数据集必须包含模型训练所需的信息要素,确保训练过程在技术层面跑得通。
第二级,半成品实用便捷。信息要素应易于提取,无需进行大量预处理即可直接投入训练。
第三级,成品有质量保障。不仅形式结构满足需求,更重要的是能有效提高人工智能模型的性能。
达到质量保障这一级别,才是国家所定义的高质量数据集。
我们呼吁为数据付费,本质上不是为原始的比特流付费,而是为数据的清洗、标注、结构化以及其带来的模型性能提升付费。
02. 为什么要付费,打破公地悲剧
目前,我国已建成高质量数据集总量超500PB,覆盖了科技、教育等15个重要领域。但要维持这一增长速度,光靠政策引导是不够的,必须依靠市场的力量。
数据从原始状态变成AI-Ready的高质量资产,需要投入巨大的算力成本、人工标注成本和合规成本。
没有付费机制,供给侧就缺乏动力, 数据持有方和数据商缺乏清洗和加工数据的资金支持。
没有付费机制,流通侧就难以持续, 目前接入的近4000家数据流通服务机构(包括数交所、运营方、数据商)需要商业闭环来生存。
没有付费机制,安全与效率无法兼得, 解决数据流通中安全、合规、高效的三角难题,需要持续的基础设施投入,而这些都需要真金白银。
正如刘烈宏所言,培育付费意识,是为数据要素市场化配置改革注入新的动力。只有当高质量数据被视为一种有价资产,而非免费的公共资源时,市场才能形成优币驱逐劣币的正向循环。
03. 数据基础设施:支撑付费流通的底座
如果说付费是软性的意识,那么基础设施就是硬性的保障。
刘烈宏指出,数据基础设施是支撑数据可信流通、应用和安全融合的关键保障。
2024年以来,国家数据局动作频频。
定标准,发布了数据基础设施技术架构等13项技术文件。广覆盖, 部署了74个先行先试任务,覆盖80%以上省区市。促生态,对外提供数据产品和服务超过1万3千个。
这一系列举措,实际上是在搭建一个可信的数据交易网络。在这个网络中,因为有质量保障,买方敢付费,因为有安全保障,卖方敢流通。
从互联网+到人工智能+,商业逻辑正在发生深刻变革。
在AI时代,数据即燃料,质量即效率。刘烈宏局长的讲话清晰地表明:数据产业正在告别粗放的跑马圈地,进入精细化的深耕细作阶段。
培育为高质量数据付费的意识,不仅是尊重知识产权和劳动成果的体现,更是推动中国人工智能产业从应用创新走向底层突破的必由之路。
延伸阅读:
数据来源:2025科创大会开幕式致辞
声明:刊载或转载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考,如有侵权或违反公众平台运营规范,请联系feedback@digitalelite.cn删除。
数字菁英网
标准参编申请
个人证书申领
数字菁英网DigitalElite.cn
数字菁英网为数字中国的设计者和建设者服务。数字菁英网下有Ai全域数字化圈、智能体Pro、首席数据官GOVCDO、人工智能GOVCDO、数据发展大讲堂GOVCDO等媒体矩阵,金英专栏、李正观点等专栏,服务数据要素、人工智能、全域数字化转型等新业态。


