11月28日上午,2025数据要素发展大会在杭州高新区(滨江)“中国数谷”成功召开。在大会成果发布环节,中国信通院云计算与大数据研究所副总工程师闫树发布并解读了《数据要素发展报告(2025年)》(以下简称报告)。
自2022年起,中国信通院云大所已经连续三年聚焦“数据要素”发布专题报告。今年这份报告,延续了前三年报告的研究脉络,立足当前数据要素领域的最新发展态势和关键任务,系统梳理了过去一年我国在数据供给、流通、应用和安全四大核心环节的最新动态。同时,在总结发展特征、研判核心挑战的基础上,对未来发展趋势提出了展望。
今年开年,由国产大模型DeepSeek引发的新一轮人工智能发展热潮中,数据作为“智能引擎”的作用进一步凸显。
从微观看,数据要素主要通过准确匹配、关联预测、重构生成这三类方式发挥作用。在智能时代,数据的重构生成作用格外凸显,通过对大量数据的深层计算、解构重组,来捕获信息生成新智慧,但这也对数据资源的汇聚、治理、应用、安全合规等提出了更高要求。而从宏观看,数据要素会经历三次价值释放,分别是业务贯通、数智决策和流通赋能。激活数据要素价值的关键,是要让这三次价值都能充分释放,通过“制度+技术+产业”的同步推进,最终实现数据“供得出”“流得动”“用得好”“保安全”。
数据已经成为推进人工智能发展的关键要素。人工智能对数据需求呈现出新特点。一个是训练数据需求量激增,数据量需求从GB级别跃升到TB级别;一个是对数据质量和模态多样性要求提高,以及伴随AI+行动推广,行业垂直领域数据需求也大量增加。
除了常见的这些结构化数据集之外,越来越多的多模态数据集、具身智能数据集、推理思维链、长视频数据集得到越来越多的关注,而且它们对于人工智能发展是非常重要的。比如具身智能数据集,就是机器人的手,实现物体抓取首先是对肌肉每个自由度进行建模,后来实现从叠毛巾到叠衣服,这个过程中都是靠数据进行迭代的,不断让它看一些训练的数据,做一些有监督的学习,从而使得它的作用能真正发挥出来。人工智能对高质量数据集需求已经成为数据要素发展的核心动力。
面向人工智能发展需求,高质量数据集建设也在加速推进。今年年初,国家数据局组织27个部委启动高质量数据集建设工作;国务院国资委也围绕10个领域推进央企数据集建设。
实践层面,一方面,工业制造、医疗卫生、交通运输等重点行业,持续深化创新应用探索;另一方面,开源社区、数据服务企业、数据标注基地、数据交易所等共同构建起稳定的多主体供给生态。在此基础上,以“研发、交付、运维、运营”四大管理为核心的高质量数据集建设方法论,也已初步形成。
从数据“供得出”环节来看:公共数据资源正在从政务数据共享、公共数据开放、公共数据授权运营三大方面强化供给。
当前,政务数据共享已迈入法治化阶段,2025年《政务数据共享条例》构建了“一盘棋”统筹的制度框架;公共数据开放方面,地方政府始终在推进,但相较于区域层面,行业层面的制度设计还需要完善,各垂直行业的数据开放还缺乏统筹规范。
授权运营方面,2025年《公共数据资源登记管理暂行办法》《公共数据资源授权运营实施规范》《关于建立公共数据资源授权运营价格形成机制的通知》三份配套文件陆续发布,为公共数据授权运营的深入实施明确了方向,我们也将在下午的专题报告解读环节为大家带来更加具体的观察分析。
技术层面上,多模态数据研发治理成为突破重点。具体代表是数据研发运营一体化(DataOps)与数据编织(Data Fabric)。其中,DataOps通过重构人员、工具与流程,打造自动化数据流水线,实现从“小作坊”到“大工厂”的转型;Data Fabric则以“逻辑集中、物理分散”为核心,依托元数据与事件驱动简化多源数据的集成,降低数据存储与运营成本。
此外,智能化数据治理也实现了范式升级,从“流程驱动”转向“认知驱动”,降低治理成本、提升治理效率。
从数据“流得动”环节来看:制度层面始终锚定全国一体化数据市场建设的战略目标,将“统筹谋划、系统培育”作为政策制定的出发点,强调全国“一盘棋”。完善统一的数据资源登记规则,数据交易、安全标准体系亟待建立。
从具体工作要点来看,一方面,全国上下均在加速培育多类型市场主体,诸多省、市、区均在多角度施策。另一方面,区域协同发展和综合试验区建设成为培育全国一体化数据市场的制度探索试验田。国家数据局部署建设10个国家数据要素综合试验区,上海、江苏、浙江、安徽等也在探索长三角数据领域一体化。
从技术支撑层面,全国一体化数据市场建设需要构建适应数据要素特征、能有效促进数据流通利用的基础设施迫在眉睫。2024年底,《国家数据基础设施建设指引》发布,提出了可信数据空间、数场、数据元件、数联网、区块链网络、隐私保护计算平台六大数据流通利用的技术设施。到今年8月,国家数据局已组织部署了两批数据基础设施建设先行先试工作,各地正在结合自身特色探索建设方案,积累建设经验。
从市场来看,场外交易仍然是数据流通交易的“主阵地”,在金融征信、商业信息查询等领域已经形成了相对成熟而固化的市场格局,但公开披露的信息不够充分,需要持续强化合规管理。今年年中,国家发布了四份数据流通交易合同示范文本,可以帮助场外市场的数据供需主体明确合规标准,降低对接成本。
此外,场内交易场所仍在积极探索发展路径。各数据交易所从合规增值服务、细分应用场景、推动公开透明等方向寻找不可替代性。并且,多个数据交易场所也正在积极推动数据交易价格互认互通,助力全国一体化市场的建设。
接下来,我们聚焦数据“用得好”环节:自《“数据要素×”三年行动计划》印发以来,国家与地方多维度部署落地。试点建设上,金融、气象、文物、医药等行业主管部门积极谋划创新试点,探索数据赋能路径。国家数据局连续两年征集典型案例和举办大赛,筛选出了很多标杆案例。
对比两年赛事和案例的变化,可以看到“数据要素×”行动愈发注重务实创新,从初期的“理念倡导”转向“市场化价值导向”,更加聚焦行业真实痛点,让数据在具体场景中真正解决问题、创造价值。
另外,数智技术的深度融合,正在推动数据应用范式发生根本性变革,让数据的价值挖掘更精准、更高效。
一是数据智能体与大小模型协同,大模型分析工具整合多类型的数据处理能力,再通过智能体调用专业小模型,实现多模态数据高质量分析,更全面地理解和处理复杂问题;二是大模型推动信息检索实现“智能化跃迁”,精准完成数据与信息整合,提升检索效率;三是大模型与知识库、知识图谱融合,结合双方优势实现复杂推理,在工业制造、交通物流、国防军事等场景中拥有广阔的应用前景。
将数据进行资产化处理和运营是“用得好”的延伸。目前,数据资源入表已从头部企业向全行业扩展。2024年,100家上市公司在年报中披露数据资源入表情况,入表金额达21.64亿元。同时,截至2025年3月,国内非上市公司凭借入表的数据资源,获得112个融资项目,合计金额14.12亿元。
尽管数据资产化探索初显成效,但仍面临数据资产权属纠纷、数据估值无统一标准、企业数据资产运营能力欠缺等问题。这些问题需要通过制度完善、技术创新与能力建设逐步破解,让数据资产化成为企业发展的“新引擎”。
最后是“保安全”环节。当前,数据安全与人工智能的深度融合,正构建起更主动、更精准的防护体系。
制度上,数据安全治理向AI领域延伸,《生成式人工智能服务管理暂行办法》《网络数据安全管理条例》等均生成式人工智能涉及的安全治理要求进行部署。
技术层面,数据安全迈向精准智能。AI技术推动数据安全保护更加精细化。AI原生平台则通过整合多源数据,构建全局风险画像,使数据安全从“被动响应”转向“智能防御”。
产业实践中,安全治理也同样从被动应对监管达标转向主动治理。更多企业开始将数据安全纳入战略顶层设计。
总的来说,2025年是数据要素市场建设继续高歌猛进的一年。围绕“供得出、流得动、用得好、保安全”的目标,我们既看到显著成效,也需正视发展中的问题。展望未来,有三大方向值得重点关注:
一是容错免责机制设计需要成为改革的关键对象。数据事业是一项长期事业,需要坚持“促发展”的总基调,营造干事创业的良好氛围,让企业敢闯敢试,才能建成活跃有效的数据市场。
二是三大方向或将在短期内快速推进。即数据基础设施建设、公共数据资源开发利用和数据产业主体培育,在国家的统筹引领下,这三项工作将形成相互支撑的合力,构成全国一体化数据市场建设的组合拳。
三是夯实各企业的数据能力,才是发挥市场主导作用的核心所在。一方面要引导传统企业与中小企业扎实建立和巩固数据管理、应用的基础能力;另一方面要推动数据龙头企业发挥引领作用,将自身的技术工具、方法论进行战略性扩散,带动全行业数据能力提升,为市场活力注入持久动力。
来源:CAICT数据要素

