文章来源:互联网新治理
本文3800字,完成全部阅读大约需要8分钟。
近日,在以“数字技术与实体经济融合赋能数字中国”为主题的第五届数字发展论坛上,国务院发展研究中心副主任陈昌盛以“关于当前促进数字经济发展的几点认识”为题作特邀演讲时,提出了“六个优先”,第一个是“数据的可及性优于数据的确权”。对于这个观点,我深表赞成!
陈昌盛副主任在演讲中还提到:“很多法学家认为,交易的发生与责任的认定建立在数据确权的基础之上,但实践表明,即便在当前世界各国都没有对数据进行确权的情况下,仍然存在责任追究机制,而只要形成了较好的责任认定和惩奖机制,数据确权就不一定是必须环节。”
受这段话启发,结合我多年来对这个问题的思考,我就索性把我关于数据确权的观点也在此和盘托出,并适当展开我的论证。

核心观点:
数据交易发展不起来主要是因为自身的一些先天问题,和有没有确权关系并不大;数据确权虽然有利于数据交易的一面,但我们也要看到数据确权不利于数据交易的另一面,这就是数据确权里的悖论。
同时,过早地确定权属,反而会自己捆住自己的手脚,限制数据的开发和利用;在现阶段,数据确权还面临一些难以克服的障碍,我们也必须认识清楚。
最后,数据在数字经济中的作用,更类似于我们日常生活里发面用的面起子(酵母、面头),它的价值在于用最少的面起子创造海量的美味的馒头和面包,而并非自身的交易,甚至食用,我们的重点应该放在交易和食用馒头、面包上,把馒头、面包的市场做大、产品做精。
其实对数据本身进行确权和交易的思路,有点类似于我们在想拿面起子来吃饱饭。我们必须转换思路,找到搞活和发展我国数字经济的真正的发力点。

2015年4月,我国第一个大数据交易所——贵阳大数据交易所正式运营。当时的执行总裁王叁寿放言,未来三到五年,交易额将达到100亿。结果,直到2021年底,该交易所的数据交易才突破亿元。
问题出在哪里,是什么导致了我们的数据交易发展不起来,其中的障碍和难点是什么,是因为没有明确权属关系才导致的交易不活跃吗?
我们不妨一个一个问题地剥开来分析:
第一,到底什么样的数据具有交易价值?分析清楚这个问题是本文的核心。
在吴军先生讲授的得到课程《信息论》中,分享过一个经典案例,就是有个英国人,很难说是极其不幸还是幸运,由于身患六种癌症,其基因等健康数据被某医药研制企业以百万高价买走,也让人们看到了个人数据巨大的交易价值。但我对此并不乐观,这种比买彩票概率还低的情形完全不具备普遍性,全球八十亿人,能找出八个这样的人就不错了,说明不了什么问题。
那么,个人信息到底有没有交易价值?我的观点是否定的,基本不具有。
为此,我们不妨列举一下我们个人身边最常见的几种数据,看看哪个是有交易价值的:
身份信息:身份证、户口本上的我们的信息;
其他证件信息:房产证、结婚证、毕业证等等证件上的信息;
健康信息:体检报告、医疗记录、基因信息等;账号密码:我们在各个平台上的账号和密码,也包括我们在银行的账号和密码;
金融信息:我们的银行存款,不堪回首的炒股记录,买卖基金等的信息;
通信信息:我们的通话记录,微信聊天记录、文字和图片、视频信息等;
在网络上发布的信息:我们在论坛、朋友圈、抖音账号里发布的信息;
交易和服务信息:我们在某宝某东里的交易记录,我们使用支付宝支付和微信支付的账单,我们使用滴滴打车和共享单车的记录,等等;当然别忘了我们还有在线下的种种交易记录,也算;
工作信息:我们在微信、钉钉和邮箱里讨论和传递的工作信息等。
这样罗列出来后,再分析就比较容易了。
首先,身份信息、证件信息、账号密码、金融信息,在别人眼里,当然都有一定的价值,但恰恰是我们最不敢公开和交易的信息,不仅可能违法,还会带来巨大的风险,得不偿失;
对于健康信息,就像前面分析的,我们不是那个英国病人,相关信息的价值不大,且不说我们愿不愿公开,对于可能有点价值的医疗记录,里面最有价值的诊疗方案这部分恰恰不是我们自己的,我们也无权公开和出售;
对于我们的通信信息、在网络上发布的信息,量一定是很大的,非常琐碎。如果我们不是什么社会名人,这些信息也不会有人感兴趣;
对于工作信息,当然不属于个人,属于我们的工作单位,我们个人也是无权公开和出售;
最后一个就是交易和服务的信息,恐怕也是大多数人认为的具有价值的个人信息的主体。但如果你仔细分析,这些个体的交易服务信息,其中的交易价值还是非常低的。
比如,我们在网上的双十一订单,除了那些用户名、地址、电话肯定是你自己的个人信息,这些就是我们前面分析的,属于我们最不愿公开和出售的信息,不具有交易价值;而那些商品名、型号、功能、价格什么的,虽然在你的订单里,但也不是你的个人信息呀,除了这些,订单里还有什么有交易价值的信息吗?
当然,这个订单或者我们之前的浏览信息本身会具有一定广告价值,可能分析出我们的购物方向,但这部分价值,已经不等到我们拿过来出售,早就被平台利用各种分析工具掌握并利用了。
这样分析下来,我们发现,信息从个体的角度,具有交易价值的只是极端个案,具备价值的其实是达到相当地量的个体数据的集合,即数据库、汇编作品或者海量数据。此外,还有政府掌握的一些数据,数据衍生品和数据分析成果等,也是具有交易价值的。但政府数据涉及政府信息公开,不宜成为盈利的对象;而衍生数据其实可以在版权层面确认和保护。
上面的分析结论就构成了我的数据确权是悖论的立论基础:
如果个人数据的主体具备交易价值,那么这里的确权就非常必要,就像我们给予个人专利、著作以知识产权一样。但目前的情形恰恰不是这样,往往很大的数据集合才有交易价值,所以如果我们给大数据里的每个数据元素确权,恰恰反而会阻碍数据的应用和交易。因为这样就需要逐个确认许可,成本很高且工作量极大,很难操作,不操作呢又涉及侵权,真正的利用者会非常纠结这个问题。
第二,关于数据确权和数据交易,数据确权和数据利用之间的关系。
基于上面的分析,我们认为,数据确权对于数据交易,大概率是双刃剑,既有有利的一面,也有不利的一面,对此我们要有清醒的认识;而数据确权对于数据开发利用,则是不利的一面更多些。
关于这种关系,我们可以从我国改革开放走过的路得出这样的判断,也就是先发展后规范的说法的由来。一般在市场发展初期,很多行为都没有规范,大家看到的都是机会,当然风险也大。但这种局面其实是对发展有利的,严格的规范一般在市场开始成熟或量足够大,行为规范已经确立的基础上展开。很少有一开始就划分得特别清晰的市场,然后蓬勃发展的。或者可以说,基本没有由法学家策划出来的市场。

还有,我们今天做的太空探索、海洋开发,基本也是在没有权属的前提下展开的,在一定意义上,权属界定得越清晰,可以创造发挥的空间可能越小。相对晚些时候确定,确定得相对模糊,对于创新发展往往是利大于弊的。比如,我国经济之所以能够快速发展四十多年,很大程度上,得益于我国最重要的生产要素——土地在权属上的相对模糊的处理:即国家的所有土地属于国家或集体。
第三,数据确权有哪些难点,确权带来的新问题是什么。
还有一种观点需要厘清,就是数据不被确权是不是我国的数字经济就发展不起来了?我完全不这么认为,大家一定要把数据的属性和知识产权的属性分开,他们之间有本质的差别。我们习惯地从理解和保护知识产权的角度理解和保护数据,其实这就是我们现在对于数据认识的最大的谬误!(重要的话应该说三遍哈)
本质差别是什么?
我创造一部小说,我发明一个专利,就是为了完成这个作品去的,也一般就是为了因此而获得利益,当然需要及时地给我确权和保护,否则我就没有创作的动力,这些都没有错。
但是,我在双十一完成一笔网购,我在从A地到B地完成一笔网约车乘坐,我的目的只是为了获得相应的商品和服务,至于因此而产生的数据,只是副产品而已。除了部分的法学家,我想不会有消费者因为一次乘坐网约车的数据没有确权给自己而下次拒绝乘坐网约车吧?
更进一步地,如果这笔订单数据没有确权给自己,而是被平台用来改进服务,只要平台不滥用,作为消费者,真的会反对吗?
数据确权带来的新问题之一:确权即侵权。
和知识产权的差别很大,数据在权利上往往不具有“洁净性”,即某个数据里面会隐藏着很多其他人的权利在里面。就像我们前面提到的我的网购订单,这里面可能有生产者的商标、专利和版权,也可能有卖家和平台的其他权利在里面,难以简单地一股脑确认给其中单一的一方。
数据确权带来的新问题之二:重复确权。
比如我们各种证件上的各种关键信息和数据,其实已经被确权过了,不需要另一个单位来重复确权。重复确权不仅不必要,甚至是有害的。
第四,怎么理解发展数字经济的要点,我们到底应该怎么做才能促进我国数字经济的发展?
数字经济里的数字如果是数据的话,它本身是催化剂、润滑剂、非终端产品,我们要的是加入他的后果,而不是直接利用其本身。那种抛开数据开发利用不谈,在数据本身上下功夫,想做成大产业和大市场的思路其实是捡了芝麻、丢了西瓜。就像我们在本文开头所做的比喻,我们吃的是面起子发起来的面和馒头,而不是直接去吃面起子解饿。
所以确保数据最大限度地流通和利用才是数字经济的核心和命脉,所有有利于这一方向的决策都是正确的。数据确权只有在可以充分推动数据开发利用的前提下才是必要的,如果没有数据交易和确权,数据一样可以流通和利用,甚至流通和利用得更好,那就已经是最优的解决方案。
在此呼应本文开头陈昌盛副主任的观点,也把这句话作为我一系列观点的结语。


