
随着共享经济时代的到来,“区块链”和“大数据”的热度越来越高,两者被同时提起的次数也越来越多。
有人认为区块链技术终会颠覆大数据技术,但实际上,区块链技术和大数据技术的创新融合才是大势所趋。
大数据面对的是海量数据,重点在于数据的广度和数量,以粗糙的方式统计分析,注重相关关系而非因果关系;
而区块链技术面向的数据更小,处理方式更细致。
区块链技术可以解决当前大数据的技术瓶颈,大数据也为区块链提供了技术环境。
两者各有所长,互相融合才能够更好地为共享经济服务。
一、区块链+大数据VS大数据+区块链
将区块链和大数据融合运用,就面临着把谁当作主体的问题。
一种是把区块链当作基础设施,大数据作为数据资产在区块链网络中进行交易,即“区块链+大数据”;
另一种是把大数据技术作为主体,区块链在其中作为数据采集和共享的新技术或为大数据提供数据源,即“大数据+区块链”。
两种技术各有侧重,运用的领域也不尽相同。
1 在区块链中融入大数据技术
区块链从本质上讲是一种分布式的数据库,这种数据库没有管理员,是彻底去中心化的。
其散列算法的唯一性和区块的联动性保证了区块链数据库中的数据具有不可篡改性,也进而保证了区块链技术的可追溯性和安全性,将更多的数据解放了出来。这是区块链技术得到重视和运用的前提。
随着区块链技术的不断发展,区块链涉及的领域将会越来越多,区块链中数据的种类和数量也会大幅增长。
而区块链的优势在于实现数据的完整记录和不可篡改,但对于数据的统计分析能力比较弱。
当数据规模越来越大时,区块链必然面临技术上的不足。
由于对海量数据的存储和迅速统计分析正是大数据技术的强项,如果能够在区块链技术中融入大数据技术就能够极大地发掘区块链中的数据价值和使用潜力,那么在区块链中融入大数据技术也就是必然的了。
单纯的区块链技术的应用范围其实非常有限,因为区块链的数据写入效率非常低,每写入一个新的数据之前计算机都要经过大量的计算,再加上同步所有节点的数据所花的时间,让区块链每生成一个新的区块的速度非常低。
有限的速度导致了单纯的区块链项目不能够让写入的数据即时使用,一个区块链数据库往往没有实际用途。
BigChainDB(巨链数据库)项目则正是在区块链技术上结合了大数据技术,填补了这项空白。
BigChainDB项目发布了一个可用的去中心数据库IPDB(Interplanetary Data-base,星际数据库)。
它具有去中心化的特点,存储的数据具有不可变性,同时还可以完成创建和交易数字资产的任务。
以区块链为基础构架,IPDB融合了大数据技术,数据写入速度大大提升,能够达到每秒百万次,同时还具备了存储PB量级规模的数据和响应时间达到亚秒级的性能。
在大数据技术的支持下,BigChainDB项目能够承载超大规模企业级别的区块链数据库,突破了现有区块链项目的每秒交易数量和数据规模的等级。
由于具备区块链技术数据不可篡改的特性,BigChainDB项目的数据库中的数据不能被随意删改,数据的稳定性和安全性得以保障。
巨链数据库的CTO Trent McConaghy表示,“我们计划建立一个无服务器的世界。
我们将IPDB的监管力度和透明度与巨链数据库的技术相结合,旨在提供一个去中心化的实际方法,而未来,我们将提供更广阔的去中心化服务。”
随着越来越多的人支持互联网去中心化,越来越多的国际峰会组织也开始积极探讨这一可能性,比如McMullen与互联网档案馆(Internet Archive)联合组织的去中心化互联网峰会(Decentralized Web Summit)等。
这类会议的举办都预示着去中心化的区块链技术将会得到越来越多的关注和应用。在区块链中融入大数据已经有了许多实际生活中的例子。
Compete Chain在区块链基础上融入大数据技术,改善了游戏产业。
在Compete Chain建立的游戏生态体系中,推出了一款依托于区块链技术的道具,它能够点对点地传输数据,在游戏中实现去中心化的支付方式,给玩家带来更加安全的支付环境。
同时CompeteChain在区块链中融入了大数据技术,用大数据分析技术为系统上层应用提供多种数据支撑。
在系统中,由于结合了大数据技术,Compete Chain的区块链智能合约系统也发挥了巨大的作用。
在大数据的助力下,智能合约能够为多种竞技游戏业务场景提供定制模板,同时还可以为用户提供用以封装智能合约的API,以方便用户在各种场景下自定义智能合约。
区块链技术作为一种分布式存储技术,从本质上看属于计算机底层技术。由于其链上的每一笔数据都可以溯源,区块链上的记录可以明确各项交易历史和各方贡献,有助于数据价值定位。
如果在区块链中融入大数据技术,区块链上的数据就可以借助大数据技术的分析预测功能作为大数据预测的数据补充,也可以用于金融等行业的风险控制,进而实现价值变现。
区块链的去中心化特点保证了数据的不可篡改性,它的运用能够解放出更多数据,助力大数据的运用。
在区块链的技术中融入大数据技术,在能够保障数据的可追溯性的前提下提升了数据库的存储能力和分析能力,并让区块链数据也能发挥作用,实现变现,极大地扩大了区块链的运用范围。
2 在大数据中融入区块链技术
随着大数据产业的发展,大数据行业也渐渐和互联网、云计算、物联网等新技术结合,将数据的价值发掘提升到了一个新的高度。
大数据技术处理数据时,有三个核心理念:
一是要全体样本而不要抽样数据;
二是要效率而不追求精确;
三是要相关关系而不要因果关系。
但大数据并非是全能的,它面临的困境也非常明确——数据的隐私性保障和数据孤岛的出现。
在数据价值越来越大的今天,数据资源在开发利用过程中面临的隐私保护问题和数据开放共享问题存在着矛盾。
开放数据共享,企业可能暴露行业机密,个人担心隐私被泄露,数据的隐私性保障就是大数据面临的第一道关卡。
如果不开放共享,数据就无法流通,是一堆没有价值的数字,即形成了数据孤岛。
另外,在数据流通过程中还有一些需要解决的痛点:
数据的归属权无法准确界定,数据的质量标准无法统一,数据来源无法保证真实性等。
这些问题不得到解决,大数据的发展就无法突破瓶颈。
大数据技术的核心思想仍是集中式的数据库技术,而与之对应的分布式数据库的典型代表就是区块链技术,区块链技术为大数据面临的瓶颈提供了解决方案。
首先,区块链的去中心化保证了数据流通的透明性,用户可以明确地看到自己的信息流通过程,阻止了信息被滥用的情况发生。
其次,区块链有助于破除大数据的孤岛效应。
所谓的大数据孤岛效应,是指互联网公司在没有完全做到大数据共享的情况下形成的“大数据集中”的问题。
在大数据孤岛的作用下,只有极少数大型公司的掌控者才具有对数据资源的使用权,而数据的生产者即普通的互联网用户反而并不能使用这些数据。
很显然,大数据的孤岛效应非常不利于降低全球市场的信用成本。
而区块链分布式账本的本质保障了不会有掌控所有数据的管理员角色出现,每个互联网用户在数据面前都是平等的,这样就破除了“大数据集中”的孤岛效应。
由于区块链的数据写入程序散列算法保证了数据库中数据的唯一性和透明性,区块链也就保证了数据的归属是一定的。
通过区块链,所有的数据都可以一一溯源,既可以保证数据的归属权,又可以考察数据是否真实有效防止虚假信息,也有助于统一数据的质量标准,上文所提到的各个痛点都在区块链的帮助下得到了完美解决。
在大数据中融入区块链技术的典型实例多发生在金融行业。
例如一家由47家日本银行组成的财团与一个名为Ripple的集体创业公司就曾签署协议,希望将区块链技术运用到银行账户的汇款项目中,以此来降低实时交易成本。
区块链技术能够降低实时交易成本的原因是它能够降低客户发生双重交易的概率。
所谓“双重交易”,就是指同一笔资金发生了两次交易,是交易失败的一种形式。
传统实时交易排查双重交易风险的技术就是通过大数据进行分析统计,大数据分析成本高带来了汇款交易的手续费高。
假如在大数据分析中引入区块链技术,就能够利用区块链数据的可追溯性快速锁定资金数据,大大提高效率,降低交易风险和成本。
除了降低银行业的交易成本,结合了区块链技术的大数据分析还能够帮助企业加强数据管理安全。
例如2015年的黑客攻击,造成了超过1亿患者的医疗信息泄露。
如果有区块链的技术支持,黑客在每个级别的数据访问中都会惊动多个用户,这样就能提高黑客被发现的概率,防止信息泄露。
大数据的运用范围越广,技术上的限制也就越明显。
只有在结合了区块链技术后,大数据技术才能突破现阶段的瓶颈,开启新技术时代。


