信息安全研究 ›› 2024, Vol. 10 ›› Issue (E2): 12-.

• 第39次全国计算机安全学术交流会入选论文 • 上一篇    下一篇

 一种针对自注意机制空间稳定性的新型扰动方法

罗云丹李灵芳罗明星   

  1. (西南交通大学成都611756)
  • 出版日期:2024-11-22 发布日期:2024-11-23
  • 通讯作者: 罗明星 博士,教授.主要研究方向为信息安全、人工智能安全、量子信息处理. mxluo@swjtu.edu.cn
  • 作者简介:罗云丹 硕士.主要研究方向为信息安全、人工智能安全. 2022200566@my.swjtu.edu.cu 李灵芳 博士研究生.主要研究方向为自然语言处理、信息安全. llf_hwj@163.com 罗明星 博士,教授.主要研究方向为信息安全、人工智能安全、量子信息处理. mxluo@swjtu.edu.cn

  • Online:2024-11-22 Published:2024-11-23

摘要: 在计算机视觉领域,Vision Transformer(ViT)展现出了强大的性能,但随之而来的是潜在的恶意扰动问题.主流的对抗扰动存在对抗样本可检测、泛化能力差等缺点.ORP(orthogonal rotation perturbation)作为一种利用自注意机制空间稳定性的新型扰动方法,通过对注意力层进行正交旋转,从而误导自注意计算.实验结果表明,不同的自注意机制在面对ORP时鲁棒性都很低,在ImageNet数据集上准确率甚至能够下降到0%.特别的,ORP的可迁移性远超其他对抗性扰动方法,并且不生成对抗样本.ORP为未来自注意模型的架构设计和使用方案提供启示,以推动更安全的自注意模型部署.

关键词: 自注意机制, 正交旋转, 鲁棒性, 可迁移性

中图分类号: