基于联邦学习和差分隐私的文本分类模型研究

信息安全研究 ›› 2023, Vol. 9 ›› Issue (12): 1145-.

基于联邦学习和差分隐私的文本分类模型研究

盛雪晨陈丹伟

(南京邮电大学计算机学院、软件学院、网络空间安全学院南京210023)

出版日期:2023-12-20 发布日期:2023-12-28

Research on Text Classification Model Based on Federated Learning and Differential Privacy

Sheng Xuechen and Chen Danwei#br#

#br#

(Department of Computer, Department of Software, Department of Cyberspace Security, Nanjing University of Posts and Telecommunications, Nanjing 210023)

Online:2023-12-20 Published:2023-12-28

摘要/Abstract

摘要： 联邦学习作为一种分布式机器学习框架, 可以在不泄露用户数据的前提下完成模型训练.然而，最近的攻击表明，在训练过程中仅仅保持数据的局部性并不能提供足够的隐私保障.因此，为了解决联邦学习训练过程中存在的隐私保护问题，提出了一种基于BERT的文本分类模型，该模型将差异隐私(DP)和联邦学习(FL)相结合，在联邦学习参数的传递过程中保证联邦模型训练过程免受推理攻击的影响.最终实验表明，提出的方法在能够保护隐私的同时仍可保证较高的模型准确率.

关键词: 文本分类, 分布式计算, 联邦学习, 差分隐私, 隐私保护

Abstract: As a distributed machine learning framework, federated learning can complete model training without disclosing user data. However, recent attacks have shown that only keeping the locality of data in the training process can not provide sufficient privacy protection. Therefore, in order to address the privacy protection issues during federated learning training, this paper proposes a text classification model based on BERT. This model combines differential privacy (DP) and federated learning (FL) to ensure that the federated model training process is protected from inference attacks during the transfer of federated learning parameters. The final experiment shows that the proposed method can maintain high model accuracy while protecting privacy.

Key words: text classification, distributed computing, federated learning, differential privacy, privacy protection

中图分类号:

TP391.1

盛雪晨, 陈丹伟, . 基于联邦学习和差分隐私的文本分类模型研究[J]. 信息安全研究, 2023, 9(12): 1145-.

[1]	杨波, 邱晓慧, 佟冬, 胡师阳, . 人工智能与隐私计算测评应用实践方案[J]. 信息安全研究, 2023, 9(E2): 25-.
[2]	柳遵梁, 周杰, 杨文根, . 医疗机构临床数据合规共享解决方案[J]. 信息安全研究, 2023, 9(E2): 41-.
[3]	吴强, 张鹤林, . 个人信息合规与保护解决方案[J]. 信息安全研究, 2023, 9(E2): 100-.
[4]	李月, 张君, 姜玮, 方竞, 谭培强, . 全匿踪隐私保护数据要素安全流通技术探寻[J]. 信息安全研究, 2023, 9(E1): 206-.
[5]	李玲, 朱立东, 李卫榜, . 6G网络安全与隐私保护的研究现状及展望[J]. 信息安全研究, 2023, 9(9): 822-.
[6]	李雅硕, 龙春, 魏金侠, 李婧, 杨帆, 李婧, . 基于同态加密的人脸识别隐私保护方法[J]. 信息安全研究, 2023, 9(9): 843-.
[7]	滕亮, 陈兵, 赵开斌, 徐涛, 李京昆, 洪薇, . 基于区块链的医疗数据安全共享模型研究与应用[J]. 信息安全研究, 2023, 9(9): 884-.
[8]	盛丹丹, . 基于大数据分析的隐私信息保护系统设计与实现[J]. 信息安全研究, 2023, 9(9): 914-.
[9]	沈传年, 徐彦婷, 陈滢霞. 隐私计算关键技术及研究展望[J]. 信息安全研究, 2023, 9(8): 714-.
[10]	江荣旺, 魏爽, 龙草芳, 杨明, . 基于联邦学习的车联网虚假位置攻击检测研究[J]. 信息安全研究, 2023, 9(8): 754-.
[11]	马龙, 张乐, 寇猛, 董睿. 基于多方安全攻防博弈的民航旅客隐私数据保护模型[J]. 信息安全研究, 2023, 9(8): 799-.
[12]	朱孟垚, 李兴华. ChatGPT安全威胁研究[J]. 信息安全研究, 2023, 9(6): 533-.
[13]	张昊星, 赵景欣, 岳星辉, 任家东, . 全生命周期数据安全管理和人工智能技术的融合研究[J]. 信息安全研究, 2023, 9(6): 543-.
[14]	李宗维, 孔德潮, 牛媛争, 彭红利, 李晓琦, 李文凯, . 基于人工智能和区块链融合的隐私保护技术研究综述[J]. 信息安全研究, 2023, 9(6): 557-.
[15]	屈梦楠, 靳宇浩, 邬江. 基于隐式对称生成对抗网络的图像隐写与提取方案[J]. 信息安全研究, 2023, 9(6): 566-.