本文是陈启恒正在进行的中国政府“十四五”国家信息化规划数字中国论坛的衍生文章。认识到数据是生产的“要素”,打破数据孤岛的工作仍然存在。

近年来,希望提高经济生产率的中国政策制定者已经发现了他们认为丰富但利用效率低下的资源:数据。2020年4月,国务院正式将数据列为生产要素,与土地、劳动力、资本、技术并列。从那时起,“要素市场化配置”的概念就进入了国家和省级的产业政策,数据资源的配置成为主要关注点。
《国家信息化“十四五”规划》是2025年科技现代化建设的总体蓝图,将建立高效的数据要素资源体系作为重中之重。《规划》旨在“激活数据要素价值,提升数据要素禀赋作用,塑造创新驱动、高质量、供给主导、创造新需求的强大国内市场”。为了进一步实现这些目标,与人口统计、交通和电信相关的公共数据将通过统一的国家开放数据平台进行共享。将鼓励公司提供对其在搜索、电子商务和社交网络方面的专有数据的访问。
释放数据存储的社会价值
这些自上而下将数据投入工作的全面努力背后是这样一种想法,即如果数据能够流向有效利用它的经济主体,那么经济效率就会在社会层面上得到提高。这一概念表述推动了促进开放政府数据和国家工业数据库的举措。广东省是政府数据开放试点省份,正式禁止政府机关将公共数据视为私有财产或阻碍其开放使用。[1]
但数据因子分配并非没有潜在的陷阱。如果数据控制者出于自身利益行事,尽管从公共数据中受益,但对公共利益的贡献不足,则可能会出现公地悲剧。除非数据属于公有制,否则数据最好被描述为一种半公共产品,非竞争性但可能具有排他性。换言之,使用特定数据资源并不需要像石油矿床一样耗尽它,但一方仍然可以限制或排除其他方访问它。[2]如果不进行干预,私营公司就没有动力分享他们的数据皇冠上的明珠,从而为新进入者提供公平的竞争环境,即使他们确实享受了公共数据的好处。
中国政府越来越愿意发挥中国特色社会主义的优势。新计划中的一句话——“有效市场和积极政府更好地融合”——抓住了这种精神。这种方法的一个含义可能是国家干预,以打破所谓的“数据孤岛”,即目前仅供私营部门或政府行为者使用的数据存储,并使数据在经济中更广泛地发挥作用。国有企业,特别是国家支持的金融机构,可能被要求做出贡献,而私营企业则被迫效仿。蚂蚁集团同意将其消费者信用数据完全整合到由中国央行控制的信用报告系统中,这体现了让私人持有的数据更广泛地获取的可能性。
鼓励分享,但不要过度分享
追求状态驱动的数据因子分配是在一个关键假设的基础上运作的。尽管从理论上讲,企业和政府机构可以通过许可或直接出售数据存储来共享资源,但人们认为,至少存在一些提高生产力的数据重新分配,而这些重新分配并不是有机发生的。为了解决这个问题,政府可以建立技术和法律基础设施,以刺激数据交易活动并释放价值。政府支持的数据交换将降低交易成本[3]通过促进需求和供应之间的相互发现,增加市场流动性,并提供解决争议的场所。
然而,仅靠低交易成本并不能激励数据控制者将高价值数据放在货架上。数据定价无疑是一个障碍,但一个更根本的障碍是,数据巨人不希望在他们的数据上贴上任何价格标签——不仅因为有商业上可行的方法可以将这些数据货币化,还因为数据定价为反垄断机构提供了一个完美的工具包,用于评估其数据驱动的市场力量。
为了实现将数据投入使用的雄心壮志,中国将不得不在一些没有其他国家找到完美答案的开放式问题上开辟出一条道路。就像税率和税收收入之间的倒U型关系(“拉弗曲线”)一样,政府诱导的数据共享与经济效率的提高之间可能也存在类似的关系。解锁高质量数据供应的胡萝卜加大棒最初会带来更高的生产力。但是,一旦数据共享超过最佳水平,数据控制者可能会开始质疑他们的竞争对手是否比他们更能从数据中受益。因此,某些数据收集和处理活动可能会被削减,从而破坏效率的提高。
同样重要的是安全与发展之间的权衡取舍。如果数据提供了价值,那么考虑到国家对数据安全的偏执,您如何防止数据落入坏人之手?隐私计算指出了一种有前途但计算成本高昂的解决方法。但是,除非这种技术解决方案被广泛采用,否则管理安全与发展之间的权衡将更多地成为一种公共政策选择。[4]中国正处于《个人信息保护法》和《数据安全法》实施的早期阶段,数据分类的行业法规正在逐步出台。即将出台的有关“重要数据”的监管细节将有助于确定哪些数据可以共享以及如何共享。认识到数据的经济价值,无疑关系到政策制定者在安全与发展之间划清界限。
不确定因素
在这种不断变化的监管环境中,尽管市场驱动的数据因素分配取决于一系列明确定义的数据权利,但数据所有权的主要问题仍然是一个法律真空。中国学者的观点从完全拒绝数据所有权到提出数据分层权利。如果引入数据所有权,随之而来的排他性将对数据生命周期中的市场参与者以及竞争公司之间的市场参与者产生深远的影响。中国既不是第一个也不是唯一一个考虑在数据所有权方面进行法律创新的国家,但结果并不明朗。
数据所有权只是中国构建数据要素资源体系时值得关注的一个主题。其他包括如何定义拥有、使用数据或从数据中获利的权利。数据控制者是否参与数据交换,以表明与国家目标保持一致或基于市场动态?隐私计算技术是否会成熟,以缓解安全与发展之间的紧张关系?如果中国政府设法将数据投入使用,它可能会成为经济向长期追求的高质量增长转型的催化剂。
[1]《广东省公共数据管理办法》第四条规定:“公共数据是一种新型公共资源,任何企业和个人不得将公共数据视为私有财产,不得阻碍公共数据的共享、开放获取、开发和利用。
[2]查尔斯·琼斯(Charles Jones)和克里斯托弗·托内蒂(Christopher Tonetti)在他们的模型中强调非竞争性,并承认数据可以具有高度的排他性。他们的主要结论之一是,“当非竞争性输入未被广泛使用时,可能会造成巨大损失。同样,哈尔·瓦里安(Hal Varian)发现数据访问是非竞争性的,但可以排除。
[3]中国拥有20多个大数据交易所。最早的一家于2015年在贵州成立,贵州是大数据相关项目的先驱省份。其运营陷入停滞,远未达到成立后3~5年内实现100亿元人民币收入的崇高目标。当前浪潮的不同之处在于,政策推动来自中央政府。北京、上海和深圳等数字经济充满活力的城市纷纷出台数据治理政策,并建立了本地数据交换中心。
[4]例如,银行可能会购买数据来了解假设借款人在其他银行积累的未偿贷款总额,而不知道每家银行的确切贷款金额。隐私计算有望使数据“可访问但不可见”,这是与数据相关的开发政策中经常提到的目标。
作者简介:陈启恒,康帕思律师事务所反垄断与竞争业务分析师。自2016年以来,他一直关注中国网络和数据治理体系的建设,并就该主题提供咨询。他拥有布朗大学计算机科学学士学位和哥伦比亚大学国际与公共事务学院国际事务硕士学位。