信息安全研究 ›› 2025, Vol. 11 ›› Issue (12): 1108-.

• 学术论文 • 上一篇    下一篇

基于SSIMGAN和时间序列Transformer的 内部威胁检测模型

冯克俊1黄晓芳1宋鲁华2殷明勇3
  

  1. 1(西南科技大学计算机科学与技术学院四川绵阳621010)
    2(四川易企签科技有限公司成都610041)
    3(中国工程物理研究院计算机应用研究所四川绵阳621900)
  • 出版日期:2025-12-12 发布日期:2025-12-03
  • 通讯作者: 黄晓芳 博士,教授.主要研究方向为信息安全、深度学习. xf.swust@qq.com
  • 作者简介:冯克俊 硕士.主要研究方向为网络安全、内部威胁检测. 1191793873@qq.com 黄晓芳 博士,教授.主要研究方向为信息安全、深度学习. xf.swust@qq.com 宋鲁华 博士,工程师.主要研究方向为信息安全、区块链、大数据及人工智能. 30805278@qq.com. 殷明勇 博士,研究员.主要研究方向为网络攻防、数据安全、态势感知. my.yin@qq.com
  • 基金资助:
    四川省科技厅重点研发项目(2022YFG0321);四川省自然科学基金项目(2022NSFSC0916)

Insider Threat Detection Model Based on SSIMGAN and  Time Series Transformer

Feng Kejun1, Huang Xiaofang1, Song Luhua2, and Yin Mingyong3
  

  1. 1(School of Computer Science & Technology, Southwest University of Science & Technology, Mianyang, Sichuan 621010)
    2(Sichuan Easy Enterprise Sign Technology Co., Ltd., Chengdu 610041)
    3(Institute of Computer Application, Chinese Academy of Engineering Physics, Mianyang, Sichuan 621900)
  • Online:2025-12-12 Published:2025-12-03

摘要: 内部威胁检测是信息安全的重要环节,旨在保护企业网络和数据安全,避免因内部人员不当行为导致的破坏.基于CERT4.2数据集提出了一种新的内部威胁检测模型,首先构建了相应的多变量时间序列数据,提出了引入结构相似度指数的辅助分类器生成对抗网络(SSIM结合ACGAN,简称SSIMGAN)对威胁数据按照不同场景进行增强,针对CERT4.2数据集中样本不平衡问题,生成更贴近原始数据分布的样本.然后,采用Focal Loss作为损失函数的时间序列Transformer(time series Transformer, TST)模型进行分类任务,使得模型更能注意到那些难分类的数据和少数样本的数据.最后,以精确率、召回率和F1值作为模型性能的评价指标进行测试.实验结果表明,相较于其他模型,该方法在CERT4.2数据集上将召回率提升至96.22%,F1值达到94.22%,验证了其在应对数据不均衡和降低漏报风险方面的有效性.

关键词: 内部威胁检测, 生成对抗网络, Transformer, 结构相似度指数, 数据增强

Abstract: Insider threat detection is a critical component of information security, aiming to protect enterprise networks and data security by preventing damage caused by insider misconduct. This paper proposes a novel insider threat detection framework based on the CERT4.2 dataset. First, we construct multivariate timeseries data and design a structural similarity indexdriven auxiliary classifier generative adversarial network (SSIMACGAN) to augment threat data across different scenarios. This approach addresses the class imbalance issue in the CERT4.2 dataset by generating synthetic samples that closely match the original data distribution. Subsequently, a time series Transformer model with Focal Loss is adopted for classification tasks, enabling the model to prioritize hardtoclassify and minorityclass samples. Precision, recall, and F1score are used as evaluation metrics. Experimental results show that our method achieves a recall of 96.22% and F1score of 94.22% on the CERT4.2 dataset, outperforming baseline models. These results validate its effectiveness in mitigating data imbalance and reducing false negative rates.

Key words: insider threat detection, generative adversarial networks, Transformer, structural similarity index, data augmentation

中图分类号: