信息安全研究 ›› 2025, Vol. 11 ›› Issue (E1): 143-.

• 2025网络安全创新发展大会入选论文 • 上一篇    下一篇

大语言模型自适应安全测评框架设计与开发

陈斌谢晓刚汤雨婷   

  1. (华信咨询设计研究院有限公司杭州310052)
  • 出版日期:2025-12-20 发布日期:2025-12-20
  • 通讯作者: 陈斌 博士,高级工程师.主要研究方向为安全靶场、渗透测试、模糊测试、AI安全. chenbin.hx@chinaccs.cn
  • 作者简介:陈斌 博士,高级工程师.主要研究方向为安全靶场、渗透测试、模糊测试、AI安全. chenbin.hx@chinaccs.cn 谢晓刚 工程师.主要研究方向为安全靶场、安全测评、人工智能、AI安全. xiexiaogang.hx@chinaccs.cn 汤雨婷 高级工程师.主要研究方向为数据安全、AI安全、人工智能、信息安全. tangyuting.hx@chinaccs.cn

  • Online:2025-12-20 Published:2025-12-20

摘要: 随着大语言模型(LLM)的广泛应用,其潜在的安全风险和伦理挑战日益显现.因此,在LLM部署前开展全面且多维度的安全评估至关重要.然而,现有评估方法缺乏系统化的安全测评框架,存在测试用例静态固化、生成耗时、覆盖率不足等局限.为应对这些问题,提出了一种自适应的大语言模型安全测评框架,具有分层、模块化和开放性架构,并开发基于大模型的自动化题库和对抗用例生成组件.测试结果表明,该框架及其组件显著提升了安全评估的全面性、时效性和准确性.

关键词: 大语言模型, 安全评估, 安全基准, 攻击提示生成, 检索增强生成

中图分类号: