大数跨境

SIICFM Insights |《智能科技月报》“隐私计算”(2021年10月,第30期)

SIICFM Insights |《智能科技月报》“隐私计算”(2021年10月,第30期) 上实资本科技基金
2021-10-28
2


概述


在大数据时代的背景下,数据已经成为推动社会发展的生产要素之一,被誉为“新黄金,新石油”。而数据的大量使用又引出了新的社会问题:数据的隐私安全该如何保证?
隐私计算的出现推动了数据安全与数据合规分享技术的发展,在保证数据的隐私安全的前提下,最大限度地挖掘数据的信息。解决的正是诸如姚期智院士在1982年提出的“百万富翁难题”--“两个富翁的财富是1-10之间的整数,如何能在不透露双方财富的前提下,比较出谁更富有?”
隐私计算是不是百亿级市场,会不会很快出现年入十亿的企业,让我们拭目以待。

目 录 


(一)一家隐私计算公司怎样才能年入十个亿?|甲子光年 

(二)“隐私计算”四大技术路径解析

(三)为什么说区块链融合隐私计算是必然趋势?

(四)百亿隐私计算市场,何以可能,何以可为?

 

注:本文仅提供观点概述,原文请点击文末链接跳转查看。




一家隐私计算公司怎么才能年入十个亿?|甲子光年

 2021-10-14  来源:刘景丰 甲子光年

2018年2月,在美国做了10余年数据安全科研工作的王爽启程回国时,被一名FBI官员拦下。对方拿出一份中国刚刚公示的新一批“海外青年高层次人才”中文名单,名单中正好有王爽的名字,他是唯一上榜的医疗隐私计算领域的专家。

 

此前,他往返中美数次,都畅行无阻。但这一次,FBI似乎对他“隐私计算专家”的身份格外在乎。在跟对方解释了两个多小时后,王爽才得以启程。
 
这看似是则个人的小插曲,但背后反映的更像是一个行业发展的先兆——在数据成为生产要素的时代,隐私计算正扮演越来越重要的角色,并受大国的重视。此次王爽回国,也正是因为他判断隐私计算将迎来前所未有的发展机遇。
 
此后确如他的预判。先是2018年5月25日,欧盟《通用数据保护条例》(简称GDPR)正式生效实施;一个月后,美国加利福尼亚州颁布了美国国内最严格的隐私立法《2018年加州消费者隐私法案》(简称CCPA),对消费者隐私权和数据安全进行保护。此后脸书和谷歌就因为强迫用户同意共享个人数据引来巨额罚款。
 
今年8月,由王爽创办、成立不到两年的锘崴科技顺利完成亿元级B轮融资。“放到两年前,投资人光是搞懂隐私计算的概念就要花上不少时间,而这次整个融资过程也只有两个月。”王爽称。投资人追捧的背后,是整个隐私计算行业加速落地——今年锘崴科技营收有望实现10倍以上的增长,而按照王爽的乐观预计,3-5年后行业就会出现营收超过10亿元的隐私计算企业。
 
这场由数据安全引发的新型计算范式,已然站在科技的风口上加速前进。
 

1.隐私计算,从概念到落地

2016年,谷歌AI在一篇技术博客文章中首次引入“联邦学习”的概念,随后这项技术开始在AI领域受到关注。所谓“联邦学习”,就是允许多个参与者在不共享数据的情况下,构建一个通用强大的机器学习模型。

简单来说就是,通过“数据不动模型动”的方法,来解决如数据隐私、数据安全、数据访问权限和对异构数据访问等问题。此后“联邦学习”逐渐受到关注,推动了整个隐私计算技术架构的完善。
 
但如果详细追究起来,谷歌并非“联邦学习”核心理论的首创者,因为在此前的4年里,中国学者王爽已对其多次论述。
 
2011年底,刚加入加利福尼亚大学(UCSD)圣地亚哥分校担任助教的王爽接到一个任务,从学术的角度搭建一个服务于美国生物医学计算网络的隐私保护计算构架。这个项目是美国国家生物医学计算中心最核心的部分,要用技术打通美国300多家医院的医疗数据,并制定一套标准。
 
此时,全球尚没有“隐私计算”的概念,王爽所有的工作要从头开始。幸好他刚完成的博士研究课题就是分布式编码。这原本是密码学的一部分,王爽试着将这一技术理念应用到医疗数据共享的新任务中,并把其称之为“安全联邦学习”。

其主要思路就是,在每次使用各医院的数据时,只把分析模型放到数据池中进行运算,而不用提取数据。这个创意性的想法不仅让医院沉睡多年的数据发挥了价值,还解决了数据安全问题。
 
2014年,王爽在美国国立卫生研究院 (NIH) 的支持下发起并组织了第一届iDASH安全计算竞赛。尽管第一届比赛只来了10支队伍,这些队伍还多是靠着主办者的“学术魅力”吸引来的高校团队,但毕竟为隐私计算的学术和医疗产业架起了一座沟通的桥梁。
 
此后,随着大赛的规模、影响力不断扩大,参赛队伍已扩展到来自互联网大厂、创业公司等上百家。如今iDASH安全计算竞赛已是全球隐私计算领域颇具影响力的赛事之一,成为各大隐私计算厂商展现实力的角逐场。
 
让王爽惊喜的是,当掌握隐私计算技术的极客跟医院的医生频繁交流后,隐私计算的技术也有了飞速迭代,“在技术性能上,每年都会有10倍的提升。”他有一个很明显的感受,此前解决一个多方联合建模的问题需要1个小时,现在只需要1分钟。
 
在突破了技术关后,隐私计算正迎来一场落地风暴。
 
2.旧技术、新风口
2018年5月,欧盟正式实施号称史上最严数据监管条例的GDPR,此后传言Facebook、谷歌等公司或将面临天价处罚。最终谷歌被法国数据保护监管机构处以5000万欧元的罚款。
 
以此作为分水岭,数据安全开始受到各大科技公司空前的关注。从2018年开始,由清华大学交叉信息研究院徐葳教授创办的华控清交,隐私计算、联邦学习领域开拓者王爽创办的锘崴科技,以及光之树等专注于隐私计算服务的创业公司先后出现。与此同时,BAT等互联网巨头以及此前的大数据、区块链、AI等领域的公司也纷纷涉足或者转型到隐私计算领域。到2020年之后,隐私计算行业发展迎来第一轮高潮。
 
“从专注程度上看,创业公司在大厂面前也不会显得有劣势,反而它的中立性是大厂所不具备的。”王爽告诉「甲子光年」。
 
尽管如此,王爽还是强调,隐私计算的技术门槛不能忽略。“在第一波隐私计算创业潮之后,很多公司便开始基于开源框架,把自己包装成隐私计算公司,对外号称自己有隐私计算的能力,然后找投资机构拿钱。”他说。
 
一方面,隐私计算所用到的技术并非是前沿的新技术。除了前文讲到的联邦学习外,还有安全多方计算,这是图灵奖华人获得者姚期智在上世纪80年代提出的;此外还有可信计算环境、同态加密、差分隐私等也都是十余年前提出的加密技术。但这些技术在应用时,会有性能上的考验。比如加密后数据的处理内存是否过大、系统的运行时间是1小时还是1分钟、构建模型的参数精度有多高。“没有几年的技术积累,这种优化是做不到的。”王爽称。
 
另一方面,隐私计算技术的应用需要很深的场景理解力,这是隐私计算商业化落地的关键,道理跟过去两年的AI落地难是一样的——只能靠深耕行业来实现。
 
基于这两方面的优势,2019年10月成立的锘崴科技,在两个月后就拿下中国医疗信息大数据国家队的项目,与其他参与者共建基于隐私计算的省级医疗云。这套隐私计算系统,可以将一个省内下辖的上百家三甲医院、上千家二甲医院、以及上万家社区医院的数据进行打通,推动医疗数据的价值转化。
 
目前,锘崴科技已经完成了超过15个项目的PoC(验证性测试),潜在客户则超过50家。
 
多位业内人士告诉「甲子光年」,随着今年9月1日《数据安全法》在国内正式实施,隐私计算在数据安全领域的落地也呈加速态势。
 

3.什么时候能年营收十亿?

王爽预期,今年锘崴科技有望实现10倍的营收增长。他还有一个更大的预期,未来3~5年,隐私计算行业将出现营收规模达10亿元的企业。
 
按照王爽的想法,要实现10亿元的商业化目标,隐私计算的盈利模式就需要转变为基于隐私计算的底层架构做开发应用,然后在这个应用程序上做相关数据的营收。“有点像滴滴、美团这种模式。”王爽称。
 
根据过去的经验,王爽发现,不同行业、不同场景对数据安全性的要求也不一样,其对隐私计算要求的效率和精度都不同。于是,他和团队把不同行业、场景进行梳理,抽象出核心的需求;然后在底层平台加上上层应用,这样平台上的不同应用可以对应不同行业、场景下的需求。
 
比如,将联邦学习、安全多方计算、同态加密等技术排列组合后形成一个个微服务,当用户提出一个需求后,可以找到对应的服务项,无需再基于每一个应用场景重新定制相应的应用。
 
这相当于把自己变成了一个基于隐私计算的数据交易平台,通过平台上的各种交易应用实现营收。这样一来,隐私计算的商业化想象力将被无限放大。
 
目前这一模式已经在国内癌症专病网络得到应用。锘崴科技将隐私计算部署到该专病网,搭建起一个覆盖全国24个省、60多家医院的癌症科研数据平台,然后药厂可以基于该平台做药品研发分析,保险公司也可以基于该平台做核保。
 
在搭建隐私计算节点的同时,锘崴科技也在推动行业标准的建立,包括跟中国信通院等10家机构一起推动“联邦学习”的行业标准,以及参与相关部委的医疗领域隐私计算国家标准的制定。
 
在隐私计算节点和相关行业标准逐步完备之后,打通跨行业数据变成一件水道渠成的事情,届时一家营收规模在10亿元的隐私计算企业也不再是空谈。
点击这里阅读原文 
一家隐私计算公司怎么才能年入十个亿?| 甲子光年

 
“隐私计算”四大技术路径解析
 2021-09-13  来源:安国平 经济参考报
隐私计算可以划分为四个不同的象限,分别是:数据流出、集中计算;数据流出、协同计算;数据不流出、协同计算;数据不流出、集中计算。
 
DT(数据技术)时代,数据已然成为一种重要的资源,是一种重要的新型生产要素。和传统生产要素相比,数据要想真正成为既可以自由流通,又能具备安全性的战略资源,就绕不开数据隐私计算这一环节。隐私计算可以让数据在流通过程实现“可用不可见”,在保护数据隐私的前提下,解决数据流通、应用等数据服务问题,成为解决数据利用和安全性这对矛盾的重要途径。
 
在隐私计算的领域中也有不同技术路径,它们采用不同的技术形式实现数据隐私安全的目标。根据数据是否流出、计算方式是否集中来划分,隐私计算可以划分为四个不同的象限,分别是数据流出、集中计算;数据流出、协同计算;数据不流出、协同计算和数据不流出、集中计算。
 
路径一:数据流出、集中计算
代表技术:数据脱敏、差分隐私、同态加密
该技术路径的核心,是对数据进行变形、扰动、加密等操作,可保障数据流出时的隐私安全,主要有三种安全技术:数据脱敏、差分隐私、同态加密。

数据脱敏(Data Masking)是指使用脱敏规则对数据中某些敏感信息进行数据的变形,从而达到保护敏感隐私数据的目的。
 
如果说数据脱敏是通过对敏感信息“做减法”的方式实现保护隐私,那么差分隐私(Differential Privacy)就是以“掺沙子”的方式,通过在数据或者计算结果上添加一定强度的噪声,来保证用户无法通过数据分析结果推断出是否包含某一特定的数据。

而同态加密(Homomorphic Encryption)则是用技术方式,在不影响数据运算结果的前提下将数据变为密文,这也就不再涉及隐私的问题,而不同的加密技术允许不同的运算规则。
整体看,这些技术通过对数据操作来保障数据流出时的隐私安全,但是它们也有一些局限性:
 
1)数据脱敏容易遭受攻击,从技术恢复数据中的敏感信息较为容易。
 
2)差分隐私会降低机器学习准确率,较高强度的噪声虽然较好地保护隐私,但对数据分析的准确性也有较大的影响。

3)同态加密运算效率低,也会影响使用该技术的意愿。

路径二:数据流出、协同计算
代表技术:安全多方计算平台
“两个富翁的财富是1-10之间的整数,如何能在不透露双方财富的前提下,比较出谁更富有?”这是姚期智院士在1982年提出的“百万富翁问题”。富翁不露财却又想做比较,按照这样的逻辑,如何在一个互不信任的多方系统中,各参与方能协同完成计算任务,同时保证各自数据的安全性呢?这就是网络安全版的“百万富翁问题”。而解决之道就是安全多方计算。
 
安全多方计算是密码学的一个子领域,其目标是为各参与方共同计算一个函数,这个函数的输入来自不同的参与方,同时保证这些输入内容不泄漏。
 
这一路径下又有两种主流技术。一种是混淆电路(Garbled Circuit)。通过将两方参与的安全计算函数编译成布尔电路,并将电路的真值表进行加密、打乱,就能保证电路的正常输出而又不泄露参与计算的双方私有信息。另一种是秘密共享(Secret Sharing),类似于需要将所有的秘密拼在一起才能还原全貌的思路,这种技术在参与者之间分发秘密,每个参与者都被分配了一份秘密分割,只有当足够数量的、不同类型的秘密分割组合在一起时,才能将秘密恢复出来;单个的秘密分割本身是没有任何意义的。
 
这一技术实现了可证明的安全性,对于安全性要求较高的场景具有较好的应用价值。但在实际落地中,仍有一定的局限性:
 
1)性能低下:由于使用了很多密码学方法,一些复杂的任务很难在在短时间内完成计算任务;
 
2)程序编写难度大:由于安全多方计算涉及密码学技术较多,且应用起来流程较其他技术相比非常复杂,通常需要通过借助额外的编程库进行实现,这大大增加了应用编写人员的学习成本和工作量,导致在实际落地过程中仍存在障碍。

3)调试难度大:由于安全多方计算仅输出最终的执行结果,在面对复杂的分析问题时,使用者难以仅通过程序的最终执行结果获得反馈去优化整个数据分析过程。
 
路径三:数据不流出、协同计算
代表技术:联邦学习平台
联邦学习(Federated Learning)的概念于2016年由Google率先提出,用于解决安卓手机终端用户在手机端使用用户数据训练模型的问题,其本质上是一种分布式机器学习。这一技术的核心思路是,尽管有同一个中央服务器或服务协同商,但参与方的原始数据都只会在本地,而不会用于交换传输,真正参与聚合的完成训练的是经过模型转换的数据信息。
 
整体看,联邦学习可以在数据不流出本地前提下,联合多个参与方训练模型,对于打破数据孤岛具有重要意义。其局限主要在:
 
1)存在隐私泄露风险,联邦学习的训练模型是需要共享的,这就为攻击者根据模型信息倒推隐私数据提供可能。
 
2)机器学习算法兼容性较差,且目前支持的机器学习算法较少。
 
3)机器学习任务调试困难,要想获得最优的模型和参数往往通过不断尝试和调试获得,一个标准机器学习工作流包括数据探索、特征工程、模型选择、超参数优化等步骤,再加上在联邦学习场景下,数据分散在各地,数据可用不可见,这些步骤很难在保证安全的前提下完成。
 
路径四:数据不流出、集中计算
代表技术:可信计算平台
可信计算平台就是通过隔离机制构建出一个安全可控区域,在这个足够安全的空间中,数据能够被集中训练且不流出,从而保证内部加载数据的机密性和完整性。
具体讲,可信计算平台又有两种技术。一种是可信执行环境(Trusted Execution Environment,TEE),该技术通过软硬件隔离安全机制建立一个安全隔离的执行环境,从而防止外部攻击者(包括系统管理员)窃取TEE内部运行的数据。硬件上,它依赖于将其预置在CPU等硬件,然后再通过应用程序的参与营造出一个安全世界。TEE具备支持多层次、高复杂度的算法逻辑实现,运算效率高以及可信度量保证运行逻辑可信等特点。然而,TEE由于依赖于CPU等硬件实现,必须确保芯片厂商可信。同时,TEE对服务器型号限制较大,其功能性和性能等均受到硬件限制。
 
另一种技术为数据沙箱技术,该技术将隐私安全能力植入大数据计算、存储引擎等基础设施,通过将调试环境与运行环境隔离,构建一个安全可控的数据环境,提升数据融合计算过程中的隐私安全水位,实现数据挖掘计算过程中的可用不可见,且不改变业务原有技术栈和使用习惯,无需改造现有的数据分析算法和工具,同时使得业务算法模型精度折损微小。因此,这可以说是兼具安全性和可操作性的较为成熟的技术。

除了上述谈及的四大技术路径,在网络安全领域,伴随网络技术的不断发展,区块链技术与上述技术流有着融合趋势。区块链具有数据可溯源、难以篡改、公开透明、智能合约自动执行等技术特点,能够一定程度上解决多方协作、多方信任和数据共享流通的问题。在与隐私计算相结合时,主要有三个关键技术:一是基于区块链的安全密钥管理与可信身份认证;二是链上、链下的安全计算协同;三是数据生命周期管理。
 
安全密钥管理与可信身份认证能够实现相对安全灵活的密钥管理体系,降低密钥中心化存储的安全风险,在防止中间人攻击和丢包攻击的同时,使得隐私管理更加安全、精细化。此外,该技术也能解决数据共享参与者身份及数据可信问题,这样,不仅可以提升恶意参与者的作恶成本,还可以保障共享计算的数据质量

链上、链下的安全计算协同又可分为链上与链下两个部分。通过链上与链下相结合,区块链专注业务逻辑可信执行与数据权属凭证流通,而链下隐私计算网络负责大规模运算和数据价值流通,最终实现一加一大于二的效果。
 
数据生命周期安全管理方面需要实现全流程管理,包括数据采集、传输、存储、使用、流通、销毁等环节。数据共享计算参与者可以在链上用智能合约来实现计算过程中的协作管理功能,由参与方之间共同治理隐私计算过程,协作过程公平公正、公开透明、权责对等,避免了中心化协调方参与带来的隐私泄漏的风险,也能确保参与方按照约定方式计算,提升数据共享协作效率。
 
区块链隐私计算目前也正投入到实际场景中得到应用。然而,它仍然具有一些问题等待进一步解决。例如,区块链上数据处理能力不足,链上计算受限于虚拟机执行和网络共识性能,容易出现链上无法承载大量交易和无法即时交付等问题,难以满足支持高吞吐的交易量和即时交付的需求。其次,由于在引入区块链技术时数据半同态加密、用户身份认证等密码学保护手段,这会使得架构上引入了额外的申请审批流程,计算上引入了加密带来的额外计算开销,使得数据流通过程效率大幅降低。
 
综上,隐私计算四大技术路径各有千秋、各有利弊。但毫无疑问的是,既具有技术上的先进性,又具有操作执行上便捷性、延伸性以及高效率等特点的技术,无疑能够在当前获得更大认可。而把握未来技术的动向,占据技术发展的上风,将成为各方参与者需追求之事。
点击这里阅读原文 
“隐私计算”四大技术路径解析

 
为什么说区块链融合隐私计算是必然趋势?| 甲子光年
2021-08-15  来源:张开翔 甲子光年
在数字化社会中,大家对于数据生产要素有着更为强烈的需求,无论是用户服务、业务营销都需要使用大量的数据,尤其是在分布式协作的业务模式中,各方都希望数据能顺畅地流通,并合理地体现数据价值。但与之相悖的是,数据孤岛仍然存在,数据的粗放式使用仍待解决。
 
与此同时,合法合规成为大势所趋。不论是在国内还是国际上,与个人信息保护、数据安全相关的法律法规一一出台,都对个人信息保护和数据安全等方面提出了更为严格的要求。这意味着,要确保数据的安全,也要尊重个人的隐私权益;在数据全生命周期上,要求实现全面规范,达成合规地流通。
 
以用户为中心,在安全隐私前提下交换数据,并提供优质合规的服务,是数字化社会建设的趋势,需要在技术、业务模式、治理体系上做出更多的创新。
 
在隐私计算领域,区块链、联邦学习和安全多方计算已然成为三大关键核心技术,而且这三大技术之间互有侧重,也有许多重合和联系。
 
其中,从区块链的角度出发,我们可以看到,一方面,区块链上的数据需要采用隐私算法来保护;另一方面,区块链也可以成为隐私计算协作里的底座和枢纽:采用区块链技术去记录、追溯多方协作中的数据集、算法模型、计算过程,并对最终结果进行评估和共识,持续优化协作效率。
 
在隐私问题尚未能彻底解决之前,我们通常采用的办法是,引入核心权威机构参与共识和维护全账本,而其他参与者则分层分片,以不同权限的角色参与。但这样,在一定程度上增加了系统的复杂性,影响了用户体验,同时,给区块链应用的规模化和普及化带来了挑战。
 
区块链可以作为分布式协作的底座,通过数据目录、数据湖等方式,构建数据流转的枢纽,同时引入隐私计算和全面的治理规则,界定数据的边界,使数据在“不出库”的同时,依旧可以实现身份认证、隐匿查询、模型构建等能力。
 
从更大的版图视角来看,要构建全面的隐私保护和治理体系,不仅需要融合区块链、人工智能、大数据、隐私计算等多种技术,还需要结合法律法规、监管治理等诸多策略。
 
“双循环”模型体现全生命周期的闭环
区块链隐私保护的场景丰富、角色众多,流程多样、数据立体,我们可以用 “双循环”机制做进一步分析。
 
首先,我们从用户端出发,尊重用户对数据的知情权和控制权,把重要的数据交给用户管理。
 
比如,验证身份的“四要素”中,用户的身份凭据和联系方式通常来自政府和运营商这些权威机构,当用户和某一个业务场景产生联系时,他们并不需要提供全部的明文信息,只需要选择性披露一些可验证的凭据,用以代替明文。

基于分布式验证机制即可实现多场景的验身,证明自己的合法身份,此时业务提供方即使未获得更多明文数据,但也不能拒绝服务。这就从根源上降低乃至杜绝了用户关键隐私的泄露风险。
 
其次,在业务方,依旧可以采用诸如联邦学习、安全多方计算等技术,对用户已经授权的、合规采集的业务数据进行处理。
 
在用户知情同意的前提下,在B端实现与合作伙伴之间的协同计算,数据不出库,隐私不泄露,但实现诸如风控、营销、广告等对业务运营有重要价值的事务。最终实现业务效果的提升,在给业务方带来效益的同时,也为用户提供更优质的服务,或者权益上的回报。其整个价值体系是闭环的,合规的,可持续的。
 
例如物联网和区块链,在采集端,就需要给设备分配身份和标识,同时算法上要做到去标识,防泄露;在用户端,不但要提供个性化的服务,还要做到防止不必要的画像,在做到可验证用户身份和资质的同时,又不能无端地追踪用户行为轨迹;最终,在提供优质服务、安全存储用户数据的时候,又要尊重用户的意愿,包括注销退出的要求。
 
如此的“双循环体系”,可能不止是在技术上要求设备、APP、后台服务进行迭代的重构,同时其商业模式、运营治理观念等层面可能也会产生许多革新。整个链条会非常的长,需要做的工作也非常多,覆盖芯片、硬件、网络、软件、云平台等广袤的产业链。
 
目前来看,并没有哪一个“包打天下”的单一技术,可以满足“全链路”、“双循环”的要求。那么我们不妨把场景拆细一点,列举得全面一些,组合一些技术和方案,先解决某个场景里的痛点问题。
 
事实上,我们在和众多产业应用开发者交流时,他们更期望聚焦于具体的、迫在眉睫的问题,得到有针对性、可着手实施的解决方案,比如转账时隐匿金额、排名时不透露分数、投票时不泄露身份、KYC流程时不泄露视频等等。

特定场景下的问题常常可以基于隐私计算的某一个算法或一些算法的组合,针对性的去应对。我们可以日拱一卒,解决一个又一个的场景化问题,对之前可能有纰漏的事情亡羊补牢,对可预见的刚性需求引入新技术新思路,创新性地去实现。这样就逐步把数据安全的篱笆一点点扎起来,最终筑就数据安全的长城。

隐私计算呼唤互联互通
分布式协作中,许多场景是跨机构的、跨网络的,无论是区块链还是隐私计算,都会遇到要和其他合作方、其他平台互通的要求。我们看到信通院的相关工作组正在讨论多项互联互通规范,核心框架是要做到“节点互通”、“资源互通”、“算法互通”。
 
节点互通要求网络和协议等基础要素能互通。资源互通强调的是对资源的发布存储、寻址使用、治理审计(含删除数据、下线服务等),在这个层面上,大家都实现相对一致的视图,提供通用的接口。算法的互通则是非常细致和场景化的,每一种算法都有自己的特点,其密码学基础、运算规则、协作流程都会不一样,反过来对资源的管理资质和节点网络的拓扑,都会提出更多的要求。

在互通基础上还有“自洽性”、“安全性”、“正确性”等要求,而且随着领域的发展,不断增加更多功能的“扩展性”也非常重要。之前,可能大家是在埋头苦干,积累技术和经验,以后在落地时,则需要更注重接口和规范,开放心态,大家一起沟通共建,通过开源开放的方式寻求共识和共赢。

隐私计算的发展思考与展望
总结一下,关于隐私计算发展的几个思考:
第一,区块链和隐私计算的融合,首先要关注C端、B端、G端的主体,缺一不可。这个“关注”,应贯穿数据生命周期的所有流程,如果仅仅是只关注自己使用数据时的便利性,并没有穿透数据的上下游,则可能会忽略用户端的体验和权益

第二,不奢望一次解决所有的问题,而是关注场景,聚焦痛点难点,逐步地、稳健地构建完善的隐私保护体系。
第三,实现标准化和普及化,以推动新技术和新理念的规模化落地。比如相关的行业标准、评测体系,这对帮助从业者理清发展道路、达成行业要求大有裨益。
 
更重要的是,要让产业、大众接受新技术,我们更要关注不同受众的感受,跳出“圈地自萌”、“自说自话”的思维模式,积极地去科普,扩大全社会对区块链和隐私计算的认知,满足各类人群对创新模式的个性化需求。
 
区块链发展这么多年,除了技术本身,其实最难的是“怎么解释清楚啥是区块链”。希望在科普推广方面,方兴未艾的隐私计算能有更多的新思路,实现更好的效果。
 
回顾区块链和隐私计算的热潮,我们看到产业和社会在呼唤数据安全和隐私保护,行业也已经有了不少可用的研究成果,得到了一定的认可。展望可见的未来,我们将更加开放、务实,聚焦用户和场景,探索规范的、规模化的、可持续的应用之路。
点击这里阅读原文 
为什么说区块链融合隐私计算是必然趋势?| 甲子光年
 
百亿隐私计算市场,何以可能,何以可为?
2021-09-24  来源:李扬霞 雷锋网
两个百万富翁在街上相遇,他们都想知道谁更富有,但又不愿意让对方知道自己拥有的真正财富。如何在没有第三方的情况下,让对方知道谁更有钱?这是姚期智院士在 1982 年提出的“百万富翁”设想。
 
这个设想的背后,本质上反映了基于用户数据挖掘的服务。信息时代,“数据”既如丰饶之角的宝藏,也犹如潘多拉魔盒,掌握着庞大的数据意味着拥有“数字霸权”与宝藏,因此,数据的拥有者必然会受到制约。在政策的加持下,隐私计算作为数据治理的重要解决方案,未来发展有哪些机遇和挑战?

1.隐私计算厂家扎堆,是好是坏?
隐私计算这个概念在最近两年迅速升温,大批的厂商涌入隐私计算领域,市场迅速被炒热。
 
一方面是因为政策趋向,另一方面是市场需求。安恒信息高级副总裁、首席科学家刘博表示:“隐私计算以前就有,但是从2019年开始,公民和政府都意识到数据泄露的危害性,开始对涉及数据源的问题进行整肃。像买卖用户画像、征信类的信息还有广告推送的用户信息等问题层出不穷。随着《网络安全法》《个人信息保护法》《数据安全法》的发布,促使企业在数据采集、使用、流通全环节中重视及投入数据保护,隐私计算行业也因此迎来重大利好。同时,数据作为参与分配的生产要素,如何在不泄露数据的前提下把数据的价值释放出来,像政府数据的对外开放以及运营商释放数据价值、数据交易市场等,一系列数字经济的市场需求都在推动隐私计算的发展。”
 
在这样的背景下,以互联网大厂、大数据公司、运营商、金融机构和金融科技企业、隐私计算初创企业为代表的五大类玩家相继入局。
 
以微众银行、百度、头条为代表的的巨头,开源了自己的学习框架,对提升行业的热度、让行业产生更多积极变化,产生了很大的作用。但是目前隐私计算还处于发展初期,技术和产品的成熟度还有提升的空间,因此会让采用这些开源技术框架的厂商面临很多挑战,工程的完成度都有待考量。
 
同时,隐私计算的提出,本意在消除“数据孤岛”、合规避险、弥合“信任鸿沟”,但在实际应用中却会形成新的数据孤岛。数据由不同的途径产生,厂商难以统计完整的数据资源,而且各厂商依赖的底层架构不同,厂商之间的数据互联不一定能实现,因此可能用户需要安装好几个厂商的软件才可以解决问题,厂家与厂家之间的数据互联互通成为新的问题。
 
本身更多的企业涌入隐私计算行业,对于提升用户对行业认知以及市场的活跃具有重要意义,但是如果造成另一轮恶性竞争,相信这是任何一个企业都不想看到的。

2.刀光剑影之间,可信执行环境技术地位如何
目前隐私计算核心技术主要包括联邦学习、可信执行环境和多方安全计算。其中业界应用隐私计算的最成功的领域莫过于联邦学习(FL)。联邦学习商业化更为成熟,通过这一方法,参与者无需上传原始数据,在每个参与者的本地执行计算,对于机器学习建模以及打破数据孤岛具有重要意义。应用该算法比较有代表性的企业和平台有微众银行、蚂蚁金服、富数科技、平安科技、数牍科技等。
 
多方安全计算(MPC)便是文章开头提到的“姚氏百万富翁问题”,解决了互不信任的参与方,能够协同计算得出一个既定值,既要保证结果的正确,又要保证参与方对数据拥有绝对的控制权。在这个方面比较有代表性的是华控清交、蚂蚁金服、富数科技、百度(点石)等。
 
据刘博介绍,虽然使用联邦学习比较多,但是也只是在特定场景下,因为联邦学习的本质是分布式机器学习,机器学习的兼容性会比较差,相对来说应用场景非常有限。同时,联邦学习的训练模型是需要共享的,这就为攻击者根据模型信息倒推隐私数据提供可能。因此有隐私泄露的风险。
 
TEE是通过软硬件隔离安全机制建立一个安全隔离的执行环境,从而防止外部攻击者窃取TEE内部运行的数据。根据相关数据统计,可信执行环境技术专利申请受到众多科技公司的青睐,数量明显高于其它两个。截至2021年8月,中国有181家公司申请了相关专利,合计815件,是隐私计算领域公司参与度最高、专利申请数量最多的技术。其次,是联邦学习和多方安全计算。
 
可能由于可信执行环境具有通用性高、开发难度低、算法实现上更加灵活等特点,在专利申请上略胜一筹。

3.价值百亿的隐私计算市场,未来走向何方?
近年来,关于用户隐私泄露、数据违规的负面事件频频登上热搜,公众对于数据安全和隐私保护越发关注。法律的监管也愈加严明,这表明国家也在逐步引导科技企业要健康发展。
 
隐私计算受到大数据融合应用与隐私保护的双重需求驱动,以及国内外政策的影响,市场正处于大爆发的阶段,未来三年可能达到100—200亿人民币的营收,但在这过程中还存在很多挑战。
 
目前主要的商业模式分为四种:第一种就是搭建软件系统,收取一次性系统搭建费;第二种是收取隐私计算软件系统的维护服务费;第三种是收取数据使用费,相当于替数据方收取费用,赚取中介费;第四种是根据业务运行效果获取收益分成。当然在实际应用中,有些企业可能会几种模式是混搭的。
 
如何在保障数据安全的前提下,充分发挥数据的价值。如何平衡数据共享开放和数据安全隐私保护的关系,是国家、行业和企业层面都需要考虑的问题。
 
点击这里阅读原文 
百亿隐私计算市场,何以可能,何以可为?

免责声明:本文版权归原作者、原网站所有,感谢原作者辛苦创作,如有侵权,请及时告知,我们将在第一时间核实并处理。
【声明】内容源于网络
0
0
上实资本科技基金
创新绿色未来
内容 747
粉丝 0
上实资本科技基金 创新绿色未来
总阅读2.2k
粉丝0
内容747