
在数字时代,数据安全的重要性不言而喻。
数据库不够安全会导致用户数据泄露,暴露用户隐私,黑客会趁机篡改用户数据谋取私利。
下面介绍两个因为数据库不够安全导致数据被篡改的案例:
案例一
2018年1月,温州警方曾在调查一个假烟销售网站时,意外发现该网站的百度搜索指数居然在香烟出售网站中排名第一。 警方经过深入追查,发现该网站的排名异常是由于有人以黑客手段干扰了百度公司搜索引擎的后台数据库,妨碍了百度搜索排名规则的正常运行,使该网站总能在搜索首页占据第一名的位置,诱导消费者进入购买。 该犯罪团伙通过干扰百度数据库,累计营业额超过7,000万元,数额之大堪称全国特大破坏计算机信息系统案。 |
案例二
刘女士曾花费500元网购了价值1,000元的一嗨租车礼品E卡,并成功在官方App上充值,然而在未使用的情况下,卡内的余额却被清零了。 刘女士的遭遇并不是个案,许多消费者都被同样的手法骗取了千元左右,全部受害者的损失累积初步估计在数十万元。 据一嗨租车工作人员表示,这些消费者的遭遇是由于公司的相关数据被黑客非法攻击篡改造成的。 |
以上两个案例都并非震惊全球的大规模数据泄露案件,但却都是与人们日常生活息息相关的实例,从中也可以看出数据库遭受黑客攻击的后果有多严重。仅仅只是某一个公司的数据库遭到黑客攻击篡改,就可能造成几十万甚至上千万的损失,如果数据篡改发生在大数据交易领域,损失将无法估量,大数据交易急需新的技术支持来保障数据交易不被篡改。
区块链技术的能力恰好能够满足这一点要求。
在理解区块链不可篡改的特点之前,仍需再介绍一下Hash算法(散列算法)。
Hash算法的基本功能是将任意长度的数据文件转换成一个唯一对应的256位字符串即散列值,且该算法不可逆。
也就是说Hash算法能够把任意文件转化为一个对应的长度固定的类似乱码的文件,且不能通过该文件反向推导出源文件内容。
Hash算法的特点使它具备了唯一性和不可逆性等优点。
不可逆性可以保证数据安全,唯一性则保证了区块链技术的不可更改性。
因为Hash算法对某一文件只能生出唯一的一个散列值,所以只要源文件有一点变动,散列值就会变得不一样。
虽然不能够通过散列值判断源文件到底哪里发生了变化,但是却可以通过散列值迅速验证某个文件在某个时刻是否存在,以及两个文件内容是否一致。
如果在区块链系统中某一节点的数据被恶意篡改,那么篡改后的数据就会被其他节点立刻识别出来并强行恢复原数据,也就是说,节点数据实际上是不能够被修改的。
在Hash算法的特性保证下,黑客如果想要篡改数据库中的交易记录,就要把超过50%的节点数据都修改一遍,因为这样才能保证修改后的数据在链中处于大多数的地位,被强行修改成一致的反而是没有被修改的原始数据,这也就是所谓的“51%算力攻击”。

51%算力攻击示意图
1、2、3代表区块链中的所有节点。在上半部分的图示中,黑客只能篡改3号节点的数据资料,由于被篡改的资料只有1/3,少于1/2,系统会认定是少部分的数据出错,即3号节点出错,强制将被篡改的3号节点的数据更改为和大部分数据一致。
在下半部分的例子中,黑客已经将2、3号的数据都篡改了,占小部分的反而是1号节点的数据,这时候系统就会认为是1号数据库出错,把1号数据强制更改为和2号、3号一致的数据。
51%算力攻击在理论上看起来是可行的,但在实际的区块链中,节点数目的增长速度比黑客掌握半数节点数目的速度快得多,而且由于节点遍布全球且互不认识,几乎没有互相串通一直篡改数据的可能,黑客也就不太可能具有51%的算力攻击实力。
当大数据中嵌入区块链技术,就能够依靠区块链的不可更改性来保障交易记录不被篡改。
比如某笔大数据交易在系统中经过验证得到了记录,整个系统中就都会有这笔交易的交易信息。
如果有不法分子想要恶意篡改其中的某些款项,就需要从记录该笔交易的第一个节点计算机开始修改,并将其后所有节点的数据都修改成一致的。
这种操作显然是不可能实现的,所以大数据的交易记录就可以在没有专人实时监督检查的情况下保证准确无误,这样既省时省力,又绝对安全。
区块链是建立在Hash算法上的一种数据库技术,其中的每个节点都互相联系互相验证,以使数据不被篡改。
区块链的这种特点刚好能够帮助大数据保障交易记录不可篡改,能让大数据更好地为人民服务,避免民众的损失。


