从政务到物流,从医疗到制造,中国正以高质量数据集为核心,掀起一场‘数据要素×人工智能’的革新浪潮!国家数据局统筹布局,标准化先行、场景驱动、基建护航,目标直指2029年全球领先的数据基础设施网络。这场战略背后,藏着哪些关键政策与突破路径?点击了解,共同迈向‘三位一体’的智能经济新时代!
2月19日高质量数据集建设工作启动会在京召开
国家数据局于2025年2月19日在北京召开高质量数据集建设工作启动会:
1. 会议背景与目的:会议旨在落实党中央、国务院关于数字经济的决策部署,贯彻党的二十大及历次全会精神,推动“人工智能+”行动,赋能行业高质量发展。会议强调数据要素市场化配置改革的重要性,并计划通过高质量数据集建设支持行业创新。
2. 参会人员:国家数据局党组书记、局长刘烈宏出席会议并发言,副局长夏冰参会。国家发展改革委、教育部、科技部、工业和信息化部、公安部、人力资源社会保障部、自然资源部、生态环境部、住房城乡建设部、交通运输部、农业农村部、商务部、文化和旅游部、国家卫生健康委、应急管理部、中国人民银行、国务院国资委、市场监管总局、金融监管总局、中国证监会、国家医保局、中国气象局、国家能源局、国家铁路局、国家中医药局、国家疾控局、国家药监局等27个部门有关司局负责同志参加会议。
3. 核心内容与要求
统筹规划:要求各部门加强协调,系统规划2025年工作思路和举措,深化部门协同,形成标志性成果。
行业赋能:高质量数据集被视为人工智能模型训练与应用的核心资源,需通过数据提质促进政务服务大模型建设及行业场景应用。
标准与评估:提出制定数据标注、管理、交付等标准,并支持农业、工业、金融等重点领域打造高质量数据集。此前发布的《国家数据标准体系建设指南》已明确数据集对“AI+”行动的基础作用。
4. 后续计划
加快推动一批标志性成果落地,如建设国家数据基础设施(目标2029年初步形成格局)。
推进公共数据资源登记平台试运行、物流数据互联试点等配套工作。
结合《“数据要素×”三年行动计划(2024-2026年)》,通过场景需求驱动数据供给,并开展行业数据集评估。
5. 政策衔接:会议呼应了前期多项政策,如《关于促进数据产业高质量发展的指导意见》《国家数据基础设施建设指引》等,强调通过数据资源整合、工具平台建设及标准制定完善数据生态。
综上,此次会议是国家数据局推动数据要素市场化的关键一步,既明确了年度目标,也衔接了长期规划,为人工智能与行业深度融合奠定了基础。
国家在高质量数据集方面的政策文件梳理(截至2025年3月3日)
国家围绕高质量数据集建设,已形成多层次、全链条的政策体系,涵盖顶层设计、标准规范、行业应用、安全保障等领域。以下是核心政策文件及要点:
1. 顶层设计与基础性政策
《国家数据标准体系建设指南》明确高质量数据集是“人工智能+”行动的基础支撑,提出数据标注、管理、交付等全流程标准框架,要求从数据生成、注释到管理确保专业性和准确性。作用:为数据资源整合与跨领域应用提供标准化依据。
《国家数据基础设施建设指引》提出构建“数据高效供给体系”,支持农业、工业、金融、教育、医疗等重点领域打造高质量数据集,并推动数据资源跨层级、跨区域流通。目标到2029年初步形成国家数据基础设施基本格局,实现横向联通与纵向贯通。
《关于促进数据产业高质量发展的指导意见》强调开发高质量数据集是人工智能应用创新的关键,支持发展“数据即服务(DaaS)”“模型即服务(MaaS)”等新业态,要求数据具备多样性、准确性和合规性。
2. 数据要素市场化与流通政策
《“数据要素×”三年行动计划(2024-2026年)》以场景需求驱动数据供给,推动政务、物流、医疗等领域高质量数据集建设,并通过试点探索数据开放互联机制。例如,2025年启动16城物流数据互联试点。
《可信数据空间发展行动计划(2024—2028年)》构建可信数据流通环境,保障高质量数据集在跨主体共享中的安全与合规,为数据跨境流动提供技术支撑。
《公共数据资源登记管理暂行办法》规范公共数据资源统一赋码与登记流程,推动全国公共数据互联互通,为高质量数据集提供基础资源池。
3. 行业应用与场景驱动政策
《国家人工智能产业综合标准化体系建设指南(2024版)》提出到2026年制定50项以上人工智能相关标准,重点支持高质量数据集在工业、医疗等场景的应用。
《政务服务大模型建设指南》要求依托政务数据资源开发高质量数据集,推动政务服务智能化,提升行政审批效率。
《数据标注产业高质量发展行动计划》针对数据标注环节提出质量提升要求,鼓励企业参与数据标注标准化实践,确保数据集的专业性和可用性。
4. 地方配套与试点政策
杭州“数据要素改革沙盒”试点:探索公共数据授权运营机制,支持企业建立行业性高质量数据集,并试点数据跨境流动。
京津冀跨域协同机制:推动三地数据互信互认、交易所互联互通,促进区域高质量数据集共享。
国家整体战略解读:以数据要素为核心,构建“三位一体”发展格局
战略目标
以高质量数据集为基石,推动人工智能与实体经济深度融合,实现数据要素市场化配置改革,形成“数据资源—基础设施—行业应用”三位一体的数字经济生态。
核心战略路径
1. 基础设施先行:构建国家数据基础设施
通过《国家数据基础设施建设指引》,布局全国一体化数据市场、算力网络和数据传输网络,为高质量数据集提供存储、流通和算力支撑。
推进“国家公共数据资源登记平台”试运行(2025年3月1日启动),实现数据资源统一管理。
2. 标准化引领:完善数据全生命周期标准
从数据生成、标注、管理到应用,建立覆盖全流程的标准体系,确保数据集质量可控。
中国信通院等机构牵头研究数据标注与模型训练的专业性标准。
3. 场景驱动创新:聚焦行业需求与试点突破
政务领域:建设政务服务大模型,推动行政审批智能化。
物流领域:开展16城数据互联试点,破解信息孤岛问题。
医疗与工业:开发面向疾病预测、智能制造的高质量数据集。
4. 安全保障与合规治理
通过《可信数据空间发展行动计划》,构建内生安全防护体系,确保数据跨境流通安全。
建立数据分类分级制度,强化个人隐私和商业秘密保护。
5. 市场化机制探索:释放数据要素价值
推动数据资源资产化管理,试点数据交易所和收益分配机制。
鼓励企业开发商业化数据集,发展“数据即服务”模式。
政策协同与未来展望
国家通过“政策链+产业链+创新链”的协同,已形成高质量数据集建设的完整闭环:
政策链:以《国家数据标准体系建设指南》和《数据基础设施建设指引》为纲,配套行业专项政策。
产业链:从数据采集(如公共数据登记)、标注(如信通院标准)、流通(如可信数据空间)到应用(如“数据要素×”行动),全链条布局。
创新链:依托人工智能大模型训练需求,反向驱动数据集质量提升。
未来,国家将进一步扩大高质量数据集在农业、交通、能源等传统产业的覆盖面,并通过“东数西算”工程优化算力资源配置,支撑数据密集型应用。预计到2029年,中国将建成全球领先的数据基础设施网络,为数字经济高质量发展提供持久动力。
—— 全文完 ——

