大数跨境
0
0

私人数据已无处可藏?这家公司在想办法保护你的隐私安全

私人数据已无处可藏?这家公司在想办法保护你的隐私安全 IT桔子每日投资速递
2021-05-18
1
导读:顶层软件和底层加速芯片互相配合,保障隐私计算安全。

作者:融数联智 袁晔


2015 年开始国内就隐私保护已发生很多事件。最近一两年,因媒体密集报道以及对某些公司用户隐私安全问题的通报,公众对隐私安全的关注成倍增长。

2015 年,我国刑法修正案开始就侵犯公民的个人信息进行定罪,到 2020 年,像数据安全法、个人信息保护法、民法典等等这些修正案的草案,相继对数据安全和公民隐私加大监管力度。尤其 2020 下半年,对隐私侵犯、隐私泄露方面做了很大力度的处罚。

IT 桔子每月举办线上直播活动,5 月 13 日邀请到融数联智 创始人兼 CEO 袁晔先生带来分享,根据活动分享整理:

顶层软件和底层加速芯片互相配合,共同保障隐私计算安全


融数联智最早从 2018 年开始就隐私计算安全方面进行产品研发、市场拓展。融数联智主要解决机构与机构、公司与公司之间,在保护公司自有数据安全的前提下,实现与其他公司进行数据安全联合应用和分析。有效避免数据明文拷贝合作方式侵犯到公司的数据资产利益。比如分别在 A、B 两家公司嵌入融数联智的隐私计算单元——一个软件加芯片的整体解决方案,也可以通俗的理解为在 A、B 公司分别装一个以隐私计算为核心的路由器。这两家公司通过路由器实现点对点的数据交互和数据连接,在数据不离开本地数据库的前提下,实现双方数据的联合运算,但发起方可以得到最后双方数据联合分析的最终结果。这样一个软件加硬件的整体解决方案就是融数联智的核心产品。

因为两家公司 A 和 B 分处两地。比如 A 公司的数据库放在北京,B 的数据库在深圳。在隐私计算过程中,要做大量的加密以及密态下的数据分析和运算,所以对 AB 两家公司的本地设备特别是 CPU 的算力要求会非常高,耗时会比明文运算呈指数型增长,达到万倍甚至百万倍的运算消耗。

同样由于 AB 两家公司分别位于两地,两方在联合运算过程中需要交换一些参数值以及中间过程,网络的延时也会影响 AB 两家公司的运算时间和消耗。软件在这个层面上是有最终瓶颈的。虽然可以通过软件方案不断去优化算法模型以及加解密的过程,但软件的所有指令都是提交给 CPU 做运算,最多提交给 GPU 做加速,不管 CPU 还是 GPU,对于整个性能的提升都是有瓶颈的。

因为这个原因,融数联智开始研究自己的加速芯片,也就是 PPU 全称 PPU Privacy Preserving Unit,即隐私保护芯片。从长远来讲,PPU 会与 CPU、GPU 一样成为一个平行芯片。PPU 有别于 CPU 的串行指令和 GPU 的并行运算,其优势在于密态下的数据运算和数据分析。PPU 对于隐私计算方面的速度和性能提升会产生巨大帮助,相对于 CPU 和 GPU 可提高百万倍的运算性能。实现百万倍加速一方面是提高密态下数据运算的加速能力,一方面提高整个网络传输的数据量,降低网络消耗和延时,这是融数联智 PPU 芯片现阶段要解决的问题。

目前隐私计算领域中涉及的技术门类非常多。基于国外一个比较权威的分类方式,分成可信执行、同态加密、多方安全算、差分隐私、联邦学习和密态数据机器学习,这六种隐私计算方式涵盖了现有可工程化的隐私计算方案。融数联智的隐私计算软件方案,结合这些技术体系中可工程化,且在保证数据安全前提下最高效实现并发运算的技术框架,软件性能方面达到工业界现有的最高性能指标。目前应用在金融、营销、政务等几大垂直的行业。在银行信贷风控、保险精准定价、证券营销、品牌获客、政务数据的对外开放和医疗信息化等方面,现阶段软件层面已经能部分地解决问题。但当数据量指数型增长且大量的非结构化数据参与到隐私计算的时候,现有软件方案会有非常高的瓶颈。

比如,传统银行信贷风控基于明文下的数据做一次联合运算,百万级样本一般在 1 分钟左右可以完成训练过程。隐私计算下跨网、跨域这种方式进行密态下的数据分析,整个耗时会呈指数型增长,由原来的 1 分钟可能会延展到 10 到 20 分钟。如果做深度学习的相关算法,时间消耗可能达到几小时,在软件层面优化这种几小时的性能消耗存在巨大瓶颈。这种性能瓶颈无法用软件方案的持续优化来解决,主要原因在于传统服务器 CPU 都是串行指令结构,GPU 虽然是并行指令,但在这一密态下的计算是无能为力的。正基于此,融数联智从 2020 年开始研发基于 ASIC 芯片方面的隐私增强能力,基于 PPU 这颗芯片来提高整体运算的性能,提升运算时效。

融数联智在软件层持续优化。首先在软件层的分布式系统框架方面,包括加解密效率以及密态运算的密码学选择和上层的模型调优上进行了大量优化工作。基于软件层的优化,在硬件层,在 GPU 加速基础之上,基于客户硬件服务器本身所具备的可编程芯片进行基于 FPGA 的加速方案,把 GPU 和 FPGA 的加速发挥到了极致。当然,融数联智还在持续深耕优化。

因为 GPU 和 FPGA 的优化,也因为 GPU 和 FPGA 本身的底层架构相对于 CPU 获得很大的提升,但从长远来讲,GPU 的并行化到一定极致之后,密态下的运算并不是 GPU 所擅长的。同样 FPGA 虽然可以做大量的并行和可编程分析,但因为 FPGA 的主频限制和 FPGA 为了考虑到可编程性,芯片本身的性能相对于单一的 ASIC 芯片来讲,性能瓶颈明显。另外,目前国内主流使用的 CPU、GPU、FPGA 芯片都以美国芯片为主。从长远来讲,涉及到隐私计算安全方面,大量采用国外芯片产品是存在安全隐患的。基于此融数联智开始设计自己的 ASIC 芯片,用于 PPU 的自主可控的 ASIC 芯片在全球范围内属于首创。

PPU 将与 CPU、GPU 平起平坐



总的来讲,在 CPU 时代,即 1960 年代,主要是以美国人为主导的一个行业爆发期,代表公司英特尔、AMD 等;第二个阶段,后边 20-30 年,芯片产业逐渐向东南亚国家和地区,包括日本、韩国、中国台湾迁移,以华人为代表,如英伟达,创立了 GPU 这样的细分领域,并且在现阶段 GPU 在某种意义上超越了 CPU 对市场的影响力,英伟达的市值也逐渐地赶超了 CPU 的主流芯片公司。

基于芯片产业逐渐向中国大陆迁移,以及国家在芯片方面的持续投入,我们将 PPU 定义为下一个能够与 CPU、GPU 平起平坐的新一代高效能芯片。未来能够与 CPU、GPU 成为平行芯片,存在于 PC、手机、可穿戴设备等终端,用于保护个人的隐私安全。基于用于隐私下的数据处理分析的 PPU 芯片,未来可能在中国大陆诞生超越英特尔、英伟达的一家公司。

在 PPU 隐私保护芯片领域,融数联智未来会考虑将芯片与现有主流的隐私保护软件,无论是基于多方安全计算、差分隐私、还是联邦学习所构建的软件体系实现无缝的迁移和支持,也就是说这款芯片可以为现有的主流的 MPC、差分隐私、同态加密、联邦学习的软件系统,实现全功能的加速。软件部分比作操作系统,PPU 芯片可以像 CPU 一样操作任何系统,对系统进行高性能加速。

因此,融数联智希望与现有主流隐私计算厂商,无论是闭源系统还是开源生态展开合作,共同构建一个良好发展的生态。融数联智 PPU 芯片可以支持自研隐私保护软件,同时也希望可以为整个隐私保护生态提供支持。纵观全球隐私计算隐私保护的市场,中国无疑走在了最前列。

目前市场上的隐私计算软件,有开源和闭源两种路径。开源是选择在 GitHub 社区上的开源方案,闭源是无论在 GitHub 还是对客户都选择代码闭源性。融数联智选择了一个中间路径,对合作方开源但不在 GitHub 上开源。选择这种路径有两个原因,一方面,国内的开源生态并不完善,开源代码存在未来被攻击的可能性,另一方面向合作方开源,保证合作方对底层代码的知情权,保证合作方的安全。



推荐阅读

▶人口数据看图:9 亿城里人;男人多出 3400 多万 ;东北性别最均衡
▶这家公司成立 2 年,估值从 0 涨到 15 亿美元
▶离开美团去创业,有人拿了王兴的投资,还有人做成了独角兽
▶张一鸣的门徒们真吃香,80% 的获投率可还行
▶《2020-2021 中国独角兽解读报告》重磅发布!中美都在孕育什么行业的独角兽?| IT桔子报告



点亮我的小星星,我们常见面吧


由于微信改版,信息流推荐顺序发生变化,桔子的消息更难找了,将桔子设为星标,就可以在前排找到我啦

分享、在看与点赞

只要你点,我们就是胖友


【声明】内容源于网络
0
0
IT桔子每日投资速递
内容 6810
粉丝 0
IT桔子每日投资速递
总阅读5.3k
粉丝0
内容6.8k