作者简介
夏家骏
光之树(北京)科技有限公司算法工程师,主要从事纵向联邦学习的算法开发等工作。
鲁 颖
光之树(北京)科技有限公司首席数据科学家,主要负责联邦学习整体算法框架研究等。
张子扬
光之树(北京)科技有限公司算法工程师,主要从事纵向联邦学习的算法开发等工作。
张钰婷
光之树(北京)科技有限公司助理工程师,主要从事纵向联邦学习的算法开发等工作。
张佳辰
光之树(北京)科技有限公司总经理及技术负责人,主要负责技术趋势研究等工作。
论文引用格式:
夏家骏, 鲁颖, 张子扬, 等. 基于秘密共享与同态加密的纵向联邦学习方案研究[J]. 信息通信技术与政策, 2021,47(6):19-26.
基于秘密共享与同态加密的纵向联邦学习方案研究
夏家骏 鲁颖 张子扬 张钰婷 张佳辰
(光之树(北京)科技有限公司,北京 100085)
摘要:由于日趋严格的隐私保护政策,各种隐私保护算法被提出。联邦学习能够在保护用户隐私不被泄露的情形下,运行各种机器学习算法。介绍了在不同场景下适用的联邦学习框架,并以逻辑回归为例介绍了纵向联邦学习的几种常用实现方式;此外,对各种实现方式的优缺点及适用场景进行了分析。
关键词:隐私计算;联邦学习;多方安全计算;同态加密;秘密共享
中图分类号:TP181 文献标识码:A
引用格式:夏家骏, 鲁颖, 张子扬, 等. 基于秘密共享与同态加密的纵向联邦学习方案研究[J]. 信息通信技术与政策, 2021,47(6):19-26.
doi:10.12267/j.issn.2096-5931.2021.06.003
0 引言
人工智能(Artificial Intelligence,AI)技术已经逐渐走进人们的生活,并应用于各个领域,它不仅给许多行业带来了巨大的经济效益,也为人们的生活带来了许多改变和便利。
一方面数据是AI的基石,数据能够为AI的发展提供丰富的数据积累和训练资源,随着大数据技术的突飞猛进,软硬件技术水平的不断提高,为人工智能取得重大突破提供了更多可能;另一方面,全球对于数据隐私方面的监管呈现全面化、密集化、严格化的趋势:我国自2018年以来,就有《科学数据管理办法》《国家健康医疗大数据标准、安全和服务管理办法(试行)》《中华人民共和国电子商务法》《数据安全管理办法(征求意见稿)》《个人金融信息(数据)保护试行办法》《关于规范银行与金融科技公司合作类业务及互联网保险业务的通知》等诸多国家法律、行政法规、部门规章等以保证数据隐私;与此同时,欧盟委员会开始强制实施《通用数据保护条例》(General Data Protection Regulation,GDPR),规定企业在对用户的数据收集、存储、保护和使用时的一系列行为规范[1]。
联邦学习(Federated Learning,FL)由谷歌在2016年提出[2],并从此受到持续关注。在国内,“联邦学习”这一概念结合数据分布的具体场景,由微众银行率先将其分为横向联邦学习(Horizontal Federated Learning,HFL)、 纵向联邦学习(Vertical Federated Learning,VFL)与联邦迁移学习(Federated Transfer Learning,FTL)[3]。联邦学习能够让多个参与方在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。本文介绍了在不同场景下适用的联邦学习方案,并以两方纵向联邦建立逻辑回归模型为例,介绍在隐私保护场景下的计算方案;然后,结合现有应用场景与平台框架,实现隐私保护场景下的两方联邦建模;最后,总结了各种方案的优缺点与适用场景。
1 联邦学习
联邦学习,通常用来描述两个或两个以上参与方共同参与,在保证各数据方的原始数据不出库的前提下,协作构建并使用机器学习模型的人工智能技术。联邦学习实际上是一个多学科融合的解决方案,包括但不限于机器学习、密码学、信息论、统计学等[4],其底层算子包括各种机器学习算法、同态加密、差分隐私、多方安全计算的各种协议(秘密共享、混淆电路、不经意传输、隐私保护集合求交)等。根据用于机器学习数据源在不同数据方之间的特征空间和样本空间的分布情况,联邦学习可以分为横向联邦学习、纵向联邦学习和联邦迁移学习,以下将对三者所对应的不同场景进行介绍(见图1)。


本文刊于《信息通信技术与政策》2021年 第6期
主办:中国信息通信研究院
《信息通信技术与政策》是工业和信息化部主管、中国信息通信研究院主办的专业学术期刊。本刊定位于“信息通信技术前沿的风向标,信息社会政策探究的思想库”,聚焦信息通信领域技术趋势、公共政策、国家/产业/企业战略,发布前沿研究成果、焦点问题分析、热点政策解读等,推动5G、工业互联网、数字经济、人工智能、区块链、大数据、云计算等技术产业的创新与发展,引导国家技术战略选择与产业政策制定,搭建产、学、研、用的高端学术交流平台。
主办:中国信息通信研究院
《信息通信技术与政策》是工业和信息化部主管、中国信息通信研究院主办的专业学术期刊。本刊定位于“信息通信技术前沿的风向标,信息社会政策探究的思想库”,聚焦信息通信领域技术趋势、公共政策、国家/产业/企业战略,发布前沿研究成果、焦点问题分析、热点政策解读等,推动5G、工业互联网、数字经济、人工智能、区块链、大数据、云计算等技术产业的创新与发展,引导国家技术战略选择与产业政策制定,搭建产、学、研、用的高端学术交流平台。
《信息通信技术与政策》官网开通啦!
为进一步提高期刊信息化建设水平,为广大学者提供更优质的服务,我刊于2020年11月18日起正式推出官方网站,现已进入网站试运行阶段。我们将以更专业的态度、更丰富的内容、更权威的报道,继续提供有前瞻性、指导性、实用性的优秀文稿,为建设网络强国和制造强国作出更大贡献!
推荐阅读
你“在看”我吗?

