大数跨境
0
0

BBD技术控丨数字货币特征分析:从比特币的交易与共识机制看区块链的特性

BBD技术控丨数字货币特征分析:从比特币的交易与共识机制看区块链的特性 BBD Data
2019-12-03
1
导读:区块链技术加上联邦学习技术将是未来人工智能领域最具发展潜力的方向之一





文丨方彦 BBD数字创新中心 


毕业于苏州大学金融工程研究中心,金融专业硕士,师从知名风险管理专家袁先智博士;曾参与为国际四大会计师事务所提供的数字货币审计技术服务项目,对区块链和反洗钱业务均有一定理解。目前正参与北京企业上市服务与风险监测平台项目,重点负责业务模型搭建与客户的数据需求分析。





01.

比特币和区块链


自2009年比特币问世以来,数字货币的数量不断增长,从主流币到稳定币,热点不停地切换。近日,上海、北京、内蒙古、深圳等多地监管部门纷纷对虚拟货币“亮剑”,或清理虚拟货币挖矿企业,或对虚拟货币相关活动展开专项整治,北京警方还一举破获非法数字货币交易所BISS诈骗案。此番整顿,是继2017年9月取缔ICO(首次币发行)之后,监管部门对虚拟货币的又一次大规模“围剿”。

区块链技术的兴起起源于比特币,但不同于近期被严查的各类虚拟货币,比特币发明的背后有着一套严格的逻辑和数理论证,区块链的创造也是为了满足比特币背后的交易逻辑而产生的。这与近期国内仅仅是为了“割韭菜”而发布的“空气币”有着本质的区别。

本文将以比特币区块链为例,从技术角度简单介绍比特币的交易流程、共识机制,以及这些特征与区块链技术之间的关系。



02.

交易的技术流程


1.交易流程简述


比特币区块链记录的并不是一个个账号,也不是一个个比特币,而是由交易输入和交易输出组成的一笔笔交易。比特币区块链系统中并没有比特币,只有UTXO(Unspent Transaction Output),也就是未消耗的交易输出。
 
比特币交易流程示意图

每笔交易都有至少一笔交易输入,也都有至少一笔交易输出。而其所产生的输出如果尚未被用作交易输入,就是UTXO。每一次的交易输入都可以追溯到之前的UTXO,直至最初的挖矿所得。由挖矿所得创建的比特币交易(又被称为coinbase交易)是每个区块中的首个交易。这笔交易由系统自动创建,分配UTXO给挖矿的矿工作为激励,因此不存在上一笔交易输出。
 
UTXO机制示意图


2.交易防伪机制


UTXO本质上来讲就是用比特币拥有者的公钥哈希锁定拥有的比特币数量,具体就是一个数字加一个锁定脚本。所有的UTXO都被存在数据库中。支付比特币的过程其实等同于消耗掉属于你的UTXO,并生成新的UTXO,用接受者的公钥哈希进行锁定。

锁定脚本的一般格式如下:

OP_DUP  OP_HASH160<pubKeyHash>OP_EQUALVERIFY OP_CHECKSIG

锁定脚本中只有公钥哈希是可变的,其它操作符都是固定的。锁定脚本里是谁的公钥哈希,谁就是这个UTXO的拥有者,谁就能花费这笔UTXO。公式中pubKeyHash公钥哈希是用公钥通过以下运算生成的:

pubKeyHash = ripemd160(sha256(pubKey))



03.
共识机制——工作量证明

在进行哈希值运算时,工作量证明机制引入了对某一个特定值的扫描工作,比方说 SHA-256 下,计算得到的哈希值必须以一个或多个0开始。那么随着0的数目的上升, 找到这个解所需要的工作量将呈指数增长,而对结果进行检验则仅需要一次随机散列运算。在比特币的区块中有一个随机数nonce,这个随机数要使得该给定区块的随机散列值出现了所需的那么多个0。通过反复尝试来找到这个随机数,直到找到为止,这样就构建起了一个工作量证明机制。


只要矿工使用的CPU耗费的工作量能够满足该工作量证明机制,那么除非重新完成相当的工作量,该区块的信息就不可更改。由于之后的区块是链接在该区块之后的,所以想要更改该区块中的信息,就还需要重新完成之后所有区块的全部工作量。

此外,工作量证明机制还解决了共识问题中的表决问题。工作量证明机制的本质则是一CPU一票,而“大多数”的决定表达为最长的链,因为最长的链包含了最大的工作量。如果大多数的 CPU 为诚实的节点控制,那么诚实的链条将以最快的速度延长,并超越其他的竞争链条。如果想要对已经出现的区块进行修改,区块攻击者就必须重新完成该区块的工作量外加该区块之后所有区块的工作量,并最终赶上和超越诚实节点的工作量。设想一个较慢的攻击者试图赶上随后的区块,那么其成功概率将呈指数化递减,这一点由下面的计算公式可以得出:

假定 p > q,那么攻击成功的概率就会因为区块数z的增长而呈现指数化下降。由于概率是攻击者的敌人,如果他不能幸运且快速地获得成功,那么他获得成功的机会随着时间的流逝就变得愈发渺茫。




04.
区块链技术的现状与发展

UTXO的信息可追溯性决定了区块链具有信息可溯源的特征,无论是信息的创建、修改,还是删除等记录,都会被记录在链上,并能够被追溯。这个特征最有代表性的应用就是在物流领域,通过结合大数据、GIS地图等组件,我们可以做到商品在物流领域的全程追踪,对某些特殊的商品,如药品、疫苗等,全程的可追溯性对质量的保证尤为重要。

以工作量证明机制为代表的区块链共识机制能够保证信息不可逆性。从前述讨论中我们可以看出,任何个体想要以一己之力修改链上的信息,其难度之大,以近乎不可能。这个特性使得区块链技术可以广泛的运用于保护特殊信息或重要信息,如应用于司法领域的存证固证,版权保护场景等。

区块链的交易防伪机制为数据安全提供了加密手段,而基于这些加密的数据进行运算的前沿技术被称为隐私计算。现在主流用于机器学习的隐私计算方法主要有三种:差分隐私、同态加密、安全多方计算。

差分隐私采用了一种随机机制,使得当改变输入中的单个样本之后,输出的分布不会有太大的改变。或者说,对于差别只有一条记录的两个数据集,查询他们获得相同的输入的概率非常接近。

同态加密能够在不解密的情况下,对密文数据进行计算。这使您无需破坏敏感源数据,同时可以对数据进行处理。同态加密方案最有趣的地方在于,其关注的是数据处理安全。同态加密提供了一种对加密数据进行处理的功能。也就是说,其他人可以对加密数据进行处理,但是处理过程不会泄露任何原始内容。同时,拥有密钥的用户对处理过的数据进行解密后,得到的正好是处理后的结果。

安全多方计算(MPC: Secure Muti-Party Computation)解决一组互不信任的参与方之间保护隐私的协同计算问题,确保输入的独立性、计算的正确性、去中心化等特征,同时不泄露各种输入值给参与计算的其他成员。

近年来,隐私计算领域的一颗冉冉之星便是联邦学习(Federated Learning),这是一种新兴的人工智能基础技术,在 2016 年由谷歌最先提出,原本用于解决安卓手机终端用户在本地更新模型的问题,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或多计算结点之间开展高效率的机器学习。

我们认为,区块链技术加上联邦学习技术将是未来人工智能领域最具发展潜力的方向之一。其中,如本文所示,区块链技术将解决数据集内部的信用、安全问题,联邦学习技术能够使得数据集之间在保护隐私、数据不共享的前提下开展机器学习。这两项技术的优势结合,基本解决了我国在大数据应用发展期间所遇到的数据质量不佳、信息孤岛等问题,一定会为我国大数据产业发展注入新的活力。


END / 


点击图片,查看往期精彩


【声明】内容源于网络
0
0
BBD Data
大数观天下,微言解疑难
内容 748
粉丝 0
BBD Data 大数观天下,微言解疑难
总阅读1.1k
粉丝0
内容748