安全多方计算之十：联邦学习与安全多方计算

联邦学习和安全多方计算都是解决数据隐私保护问题的技术，两者既有联系又有区别。本文针对两种的基本概念、应用场景、区别与联系进行了详细介绍。

机器学习Zero

4020人浏览 · 2023-03-31 21:51:22

机器学习Zero · 2023-03-31 21:51:22 发布

联邦学习与安全多方计算

1. 联邦学习
2. 安全多方计算
3. 联系与区别

1. 联邦学习

联邦学习（FL，Federated Learning）是谷歌于2016年提出的一种分布式机器学习框架，可以在保护个人数据隐私的前提下，联合多方用户的数据实现模型训练。

联邦学习用于解决“数据孤岛”问题，核心思想是“数据不动模型动，数据可用不可见”。

传统机器学习中，数据需集中在一起进行模型训练，这样会暴露个人隐私，且数据共享也面临信任问题。
联邦学习中，数据被分散在多个地方，每个地方的数据在本地进行处理形成本地模型，本地模型通过联邦学习算法进行汇聚和更新，最终得到一个全局模型。这样既保护了隐私，同时也避免了数据共享的信任问题。

联邦学习的应用场景非常广泛，如医疗领域，由于涉及到患者的隐私数据，传统的中心化机器学习方法难以实现，而联邦学习可以实现不同医院之间模型的共享和更新，从而提高诊断和治疗的准确性和效率；金融领域，联邦学习可用于风险控制、欺诈检测等，提高金融机构的业务效率和风险管理能力；智能物联网领域，联邦学习可用于实现不同设备之间的智能交互和协作，提高智能物联网系统的性能和可靠性。

2. 安全多方计算

安全多方计算（SMC，Secure Multi-party Computation）由由中国计算机科学家、2000年图灵奖获得者姚启智教授于1982年在论文《Protocols for secure computations》中以百万富翁问题（两个百万富翁Alice和Bob想知道他们两个谁更富有，但他们都不想让对方及其他第三方知道自己财富的任何信息），开创了密码学研究的新领域。

安全多方计算定义：是指在一个互不信任的多用户网络中， $n$ 个参与者 $P_1,P_2,...,P_n$ ，每个持有秘密数据 $x_i$ ，希望共同计算出函数 $f(x_1,x_2,...,x_n)=(y_1,y_2,...,y_n)$ ， $P_i$ 仅得到结果 $y_i$ ，并且不泄露 $x_i$ 给其他参与者。

安全多方计算同样广泛应用于政务、医疗、金融、交通等各个领域中保护隐私的数据统计、数据分析、数据挖掘。如用户画像要从多个数据源中获取用户的身份、属性、行为、关系等各类数据，并进行群体的分析挖掘。但在数据的获取与计算过程中会导致用户隐私泄露，可使用安全多方计算技术，在保护隐私的情况下，对数据进行分析计算。