
区块链既然本质上是一种数据库技术,那么就有着所有数据库的本质特性:采集、存储与分析数据。
而大数据技术能够有用武之地的前提就是有足量的、不断更新的数据产生,区块链作为数据库的一种,必然能够为助力大数据技术发展出一份力。
由于区块链的分布式数据特点,每一个节点的数据变动都会造成全体节点的变化,也就是说区块链中的数据具有互相联系、无法篡改的特点,这也就保证了区块链数据的可追溯性和安全性。
基于这些特性,区块链帮助解放了更多数据参与到数据共享中(因为不用再担心数据资源被滥用而找不到责任人),为大数据技术提供了数据采集上的技术突破,也因为数据的可信任度高给大数据提供了数据存储的新技术,还因为去中心化的特点给数据分析带来了新突破。
数据采集:区块链解放更多数据
在使用区块链技术之前,大数据的数据资源主要集中在少数大型互联网公司的手中,出于利益和安全考虑,这些数据并没有做到完全意义上的共享。
例如电商平台的用户搜索数据不可能轻易与社交平台发生共享,以减少用户隐私泄露的概率。
同样是基于利益和安全的考量,还有相当一部分数据没有被运用到大数据处理中,比如科研行业的计算数据等。
但是数据资源的开发利用只有基于更多的数据才能得到更深入的分析结果,这也就意味着需要寻求一个更好的解决办法来帮助解放出更多数据。
除了发生共享的数据资源有限,以交易形式流通的数据也存在问题。
中国互联网电子数据研究院研究员、保全网联合创始人王毛路表示,现在的数据交易存在许多根源上的痛点没有解决,现有的大数据交易所完成的交易是点对点传输的交易,不能达到使数据多元融合的结果。
数据不能融合,就无法产生符合各种需求的数据产品,数据的价值也就没有体现。
为什么数据交易无法完成数据的融合呢?
这是由数据的特殊性决定的。
与商品不一样,数据因为具有可复制性,在交易中容易发生所有权交接不清晰的情况。
例如,A公司作为卖方和B公司产生交易,如果是普通商品,一旦钱货交割明确,商品的所有权就从A公司转移到了B公司;
但如果买卖的是数据资源,当交易达成后,数据的所有权理论上应该是B公司,但实际上A公司依旧会拥有这批数据,这就发生了数据所有权交接不清晰的情况。
因为这种隐患的存在,大数据交易的买卖双方以及中介都是互不信任的,这显然也是大数据流通的阻碍之一。
无论是出于数据安全性的考虑,还是大数据交易现存的困境,都明确地传递出一个信息:大数据急需新技术来保障数据的采集和流通。
那为什么区块链技术能够解决这些痛点,帮助释放出更多数据呢?
这还要从区块链技术的“时间戳”说起。
时间戳的定义是“一个能表示一份数据在某个特定时间之前已经存在的、完整的、可验证的数据,通常是一个字符序列”,通俗来讲,就是能够证明某个数据的一系列变动的字符串,通过该字符串的解读就能够确认某份数据的来源和变化情况。
由于这个字符串会记录数据随时间的每一个变化而且无法消除,就像戳印一样给数据盖了章,所以被称为“时间戳”。
区块链是分布式账本的形式,每一个节点的数据发生变化时,都需要其他节点共同验证并记录。
这样一来,区块链数据的每一个小变化都将被全体节点一一打上时间戳,记录在案。
时间戳的存在,保证了数据的可追溯性。
每一笔数据的产生和流动,都将被时间戳诚实记录并得到全网公证。
一方面“加戳”使得数据的产生和变动会告知全网,保障了数据流通过程中的透明性和可查性。
在这样的条件下,即使不知道数据的具体内容,交易者也能及时查出该笔数据的源头在哪、产生过几次交易、是否被人使用过以及是否还具有利用价值等信息,原有的中介对数据进行复制的隐患也不复存在。
这样一来,就能解决大数据交易中的数据所有权的问题,帮助扩大大数据交易的规模。
另一方面,区块链技术会将数据进行多重加密,数据内容被查看的记录也会被时间戳记录下来。
一旦出现问题,就可以通过时间戳的记录迅速锁定进行过相关操作的人,大大加快了责任认定的速度。
这样一来,窃取数据的行为就无法隐形,数据安全也就得到了保障。
1997年,密码朋克成员哈伯和斯托尼塔最先提出用“时间戳”的方法来保证数字文件安全,并发布了相关协议。
在协议中,哈伯和斯托尼塔对“时间戳”的简单解释是一种用以表达文件创建顺序的代码,同时协议还规定一旦文件创建成功,其时间戳就不能改动了,这样一来,文件就不可能被篡改。
哈伯和斯托尼塔提出的这项安全协议就是后来比特币区块链协议的原型,因此区块链技术具有了时间戳的特点,区块链上的数据因而也就有了去中心化、不可篡改、高透明、可追溯的特点,而这正是区块链能够解放更多数据进入大数据共享时代的关键所在。百度公司应用了时间戳来保障原创图片的权益。
百度上线了一款区块链原创图片服务平台“图腾”。
该平台采用了百度自主研发的区块链版权登记网络,配合以可信时间戳和链戳双重认证,将上传的每张原创图片都生成唯一的“版权DNA”,登记在区块链网络中。
这样一来,所有原创作品都可真正实现溯源追踪。
除此之外,图腾还可以与区块链图片存证系统和维权工具“版权卫士”共同合作,对原创作品进行流向监测,监督盗版行为。
一位百度区块链的内部人士表示,“这款产品将是区块链的‘急先锋’,可为入驻用户提供确权、监控、维权的一站式服务,并且入驻时无须缴费。”
据报道,图腾已经和视觉中国、壹图等五家图片机构展开了合作,实现原创作品的版权保护。
可以预见,随着人们的版权意识逐渐提高,百度图腾绝不会是唯一一家运用区块链技术实现版权保护的平台,未来市场上会有更多的企业利用具有时间戳的区块链技术实现数据的确权和溯源。
图腾的成功应用说明了区块链技术的时间戳确实可以实现数据的溯源追踪。同样的,区块链就可以在时间戳技术的配合下为所有数据打造一个可追踪的平台。
这样一来,现有的数据就可以安全地流通,大数据的采集也就变得更加容易。
在以区块链技术为基础的网络中,数据资产一旦通过区块链技术注册后,时间戳的存在会使其来源、交易记录都成为全网公示可查的信息,并且可以追溯,这样数据安全就有了保障。
有了保障,更多的数据资源才能够被放心释放出来,参与到大数据技术中,大数据的采集困境也就得到了解决。


