
在第七届数字中国建设峰会上,全国数据资源调查工作组(国家工业信息安全发展研究中心)发布《全国数据资源调查报告(2023年)》(以下简称《报告》)。这是我国首次对数据资源进行“全面体检”。根据国家数据局等多部门的最新调查结果,我国数据生产的规模优势基本形成。
当前,我国数据资源有以下几个特征:
一是数据生产规模大,范围广,增长速度快。我国数据生产规模持续扩大。2023年数据生产总量达到32.85泽字节(ZB),同比增长22.44%,非结构数据爆发式增长。随着5G、AI技术的快速发展及智能设备的规模应用,内容创作、影像视听等非结构数据对我国数据总规模增长贡献较大,消费民生领域新业态不断涌现,满足了人们不断增长的文化娱乐消费需求。
智慧城市扩大物联感知范围。公共数据获取范围不断扩大,设施物联传感数据 占比超40%。城市各种基础设施、资源、服务等加速数字化、网络化、智能化升级, 摄像头、传感器、无线设备等相互连接形成城市的“神经脉络”,实时捕捉城市交 通、人流等各种信息,推动海量数据从大街小巷汇入城市大脑。
智能应用推动数据产量提速。随着技术的创新突破以及硬件的迭代更新,生产生活的数字化应用逐渐增加,推动我国数据产量快速增长。在生活方面,智能网联车驱动车、路、网、云数据快速交换,出行数据同比增幅达到49%。在生产方面,老旧生产设备的升级改造以及智能边缘设备、工业机器人、数控机床等智能设备的推广应用,推动生产制造数据同比增幅达到20%。
二是数据存储空间合理,终端存储高于云存储,产存转化待提升。存储总空间基本满足存储需求。2023年我国累计数据存储总量为1.73泽字节(ZB),存储空间利用率为59%。其中政府和行业重点企业存储空间利用率均为70%左右。数据服务商对存储空间提前布局,存储空间利用率为35.29%。随着企业算力的不断提升,对数据存储除性能要求外,更需高扩展性来为海量数据“矿产”的挖掘做准备。
数据终端存储高于云存储。数据云存储占比约超过40%,其中,行业重点企业云存储占比为23.49%。云存储高灵活性和高便捷性优势有效支撑了业务协同带来的数据交互需求。行业重点企业数据终端存储占比超七成,海量数据被分散存储,数据互联、复用难度较大,但边缘智能化一定程度上能促进数据从存向用转化。
数据产存转化率较低。2023年新增数据存储量为0.95泽字节(ZB),与年数据生产总量相比,占比为2.9%,数据价值潜力有待进一步挖掘。一方面海量数据复用价值较低,大部分过程类数据产生后即被丢弃、覆盖。另一方面大模型、训练工具等支撑能力不足,海量数据开发利用价值低于存储成本,部分高价值数据在“大浪淘沙”过程中被遗弃。
三是算力规模增长快,区域算力按需布局,智算能力需求旺。算力中心规模持续增长,算力建设仍需适度超前布局。至2023年底,2200多个算力中心的算力规模约为0.23十万亿亿次浮点运算/秒(ZFLOPS),同比增长约为30%。与此同时,大模型训练算力需求高涨,科学、政务、金融、工业等行业算力需求随之增加,一体化算力体系建设仍需加快推进,保持适度超前布局。
区域算力按需布局,东西部算力协同仍待发展。一方面,算力枢纽按需布局趋势明显。东部地区实时计算需求增幅较大,实时数据处理仍依赖于本地算力。京津冀、长三角、珠三角地区算力规模占比达58.61%。另一方面,东数西算仍需进一步发展。西部地区凭借绿色化和低成本的算力优势逐步承接东部计算需求。如影视制作企业、云服务商等借助西部算力中心大幅缩减成本。然而西部地区存算利用率仍然低于东部地区。
大模型需求不断增加,智算支撑能力仍需提升。至2023年我国智能算力占比约为30%,各行业各领域对智能算力的需求日趋强烈,而能够支撑行业垂直领域大模型落地的算力不足,大模型与国产软硬件的适配性问题尚需解决。
四是数据流通方式多元,交互能力有提升,交易供需不均衡。消费领域数据交互活跃度较高。2023年,四大运营商数据显示全国数据总流 量较去年同期增长7.6%,数据流量保持稳步增长。随着汽车、家居、穿戴等智能终 端品类不断丰富和声像视听数据交互需求持续增加,移动互联网数据流通活跃度 不断增加。
平台和央企数据流通量远超其他企业。中央企业和平台企业成为行业领域的数据枢纽,在各自领域探索交互机制。本次调查中,平台企业平均数据交互量为行业重点企业的249倍,各行业数据正逐渐向平台聚拢。SaaS服务模式日益成熟,平台提供数据产品中SaaS化产品占比超五成,订阅式交易占比逐年增多。中央企业成为产业链数据枢纽。本次调查中,中央企业平均数据交互量为行业重点企业的42倍。链主企业正在通过产业链协同赋能上下游企业,汇聚全产业链数据。
交易机构加快建设,场内交易吸引力不足。全国各地交易所快速铺开,19个省市建立数据交易机构。上海、浙江、深圳、海南等地数据交易机构“百花齐放”,交易模式、数商生态、技术底座各具特色。交易机构在标准、规则方面尚未达成共识,场内交易吸引力不足。
数据交易机构供给水平难以满足旺盛的数据需求。数据需求快速增长,制造业、信息服务、批发零售等行业数据需求量较大。与此同时,交易机构数据产品成交率不高。27家交易所上架数据产品中仅有17.9%实现交易,数据场内交易活跃度较低。例如,消费民生领域数据产品购买方数量是供给方的2.4倍,但产品成交率不足一成,存在供需不匹配的现象。
五是公共数据开放共享初见成效,授权运营起步探索,政企数据融合不断深入。公共数据体系完善,数据汇聚能力不断提升。截至2023年12月底,全国一体 化政务数据枢纽接入53个国家部门、31个省/自治区/直辖市和新疆生产建设兵团 数据,挂接资源达2.06万个,实现累计调用5361.35亿次服务。
公共数据开放共享提升政务服务水平。国家行业主管部门、地方省级政府开放数据量比上年增长16%、18.5%。高频政务服务事项实现“一网通办”“跨省通办”,逐步向标准化服务发展,电子证照、身份识别等已实现数据全国协同。公共数据共享满足率仅在少数应用场景得到满足,但大多数需求场景暂不明确的领域,与应用解耦的基础类数据,还需进一步提升数据共享效率。
公共数据授权运营机制正初步探索。人力资源和社会保障部、文化和旅游部、国家市场监督管理总局、国家卫生健康委等国家部委开展了公共数据授权运营。北京、浙江、上海、重庆等15个地区的省级数据管理部门开始探索公共数据授 权运营机制。公共数据应用场景主要为公共服务和社会管理。公共数据与企业数据加深融合应用。
公共数据在数据开发利用、流通交易中 占比较大。平台企业、数据分析企业对公共数据需求高涨。本次调查中,有18.6% 的平台企业和51%的中央企业在数据开发利用过程中应用到政府开放数据。工商、气象、交通、地理等公共数据广泛应用于数据开发利用中,成为释放数据价值的催化剂。

来源:国家数据局
点击文末“阅读原文”获取《报告》全文

