基于属性加密的联邦学习参与方选择方案
网络安全与数据治理 4期
邱浩宸,张信明
(中国科学技术大学计算机科学与技术学院,安徽合肥230026)
摘要: 联邦学习通过让用户使用本地数据训练模型来保护隐私,但现有的工作普遍忽略了真实场景下参与方的异质性。针对传统联邦学习难以避免与不恰当参与方共享模型的问题,提出一种联邦学习参与方选择方案。设计新的可撤销的密文策略属性基加密算法,在不泄露隐私的前提下对参与方实现高效的访问控制。对所提出的方案进行安全性的深入讨论,同时使用公开的数据集进行模拟实验,结果表明所提方案在提供可靠参与方选择应用的同时极大提升了模型的性能,能促进联邦学习在智慧城市等场景中的广泛落地。
中图分类号:TP181
文献标识码:A
DOI:10.19358/j.issn.2097-1788.2023.04.011
引用格式:邱浩宸,张信明.基于属性加密的联邦学习参与方选择方案[J].网络安全与数据治理,2023,42(4):62-69.
文献标识码:A
DOI:10.19358/j.issn.2097-1788.2023.04.011
引用格式:邱浩宸,张信明.基于属性加密的联邦学习参与方选择方案[J].网络安全与数据治理,2023,42(4):62-69.
Client selection scheme for federated learning with attributebased encryption
Qiu Haochen,Zhang Xinming
(School of Computer Science and Technology, University of Science and Technology of China, Hefei 230026, China)
Abstract: Federated learning protects privacy by enabling users to train models with local data, but existing works has generally ignored applicability in realworld scenarios. In view of the problem that traditional federated learning frameworks cannot avoid sharing models with inappropriate participants, an efficient federated learning participant selection scheme is proposed. A new ciphertextpolicy attribute based encryption with attribute revocation is designed to achieve efficient access control for participants without disclosing privacy. The security of the proposed scheme is discussed in depth, and the simulation experiment is carried out with open datesets. The results show that the scheme greatly improves the performance of the model while providing reliable participant selection applications, which can promote the widespread implementation of federated learning in smart cities and other scenarios.
Key words : attribute-based encryption; federated learning; attribute revocation
0 引言
随着机器学习的广泛应用,其在各个领域都取得了令人瞩目的成就,从智慧城市产生的海量多源数据中建立机器学习模型的需求变得愈加强烈。在能源、医疗和社区治理等方面人们迫切需要使用机器学习模型来执行诸如识别和预测等任务。然而,训练数据的获取是一个无法回避的关注点,严格的公民信息保护条例以及人们对个人隐私的保护要求使得城市正在诞生一个个“数据孤岛”。联邦学习被认为是在智慧城市的场景中训练模型的很有应用前景的技术。在这个框架下,机器学习模型可以由分布在各地的参与方使用本地的数据进行合作训练,从而避免了隐私数据的泄漏。自从谷歌公司提出使用联邦学习来预测用户下一个键盘输入的应用以来,已经有众多研究者参与到这一热门的研究方向。
有别于传统的集中训练,联邦学习中的数据类别通常是非独立同分布的,此外由于拥有的数据量不同,参与方可能在每个训练轮次训练不同数量的样本。这些异质性会显著影响模型训练时间和准确性,因此选择恰当的参与方进行训练尤为重要。然而现有的联邦学习参与方选择方案要么是根据对模型更新的贡献度量来选择具有更高统计效用的客户端,要么是根据计算资源和通信约束来选择客户端。这些方案虽然取得了一定的效果,但也存在着隐患,比如某些参与方利用上传的梯度信息进行隐私推断,以及某些参与方企图以不劳而获的方式得到全局模型。
本文详细内容请下载:https://www.chinaaet.com/resource/share/2000005270
作者信息:
邱浩宸,张信明
(中国科学技术大学计算机科学与技术学院,安徽合肥230026)
此内容为AET网站原创,未经授权禁止转载。