大语言模型自适应安全测评框架设计与开发

信息安全研究 ›› 2025, Vol. 11 ›› Issue (E1): 143-.

• 2025网络安全创新发展大会入选论文 • 上一篇下一篇

大语言模型自适应安全测评框架设计与开发

陈斌谢晓刚汤雨婷

(华信咨询设计研究院有限公司杭州310052)

出版日期:2025-12-20 发布日期:2025-12-20
通讯作者: 陈斌博士，高级工程师.主要研究方向为安全靶场、渗透测试、模糊测试、AI安全. chenbin.hx@chinaccs.cn
作者简介:陈斌博士，高级工程师.主要研究方向为安全靶场、渗透测试、模糊测试、AI安全. chenbin.hx@chinaccs.cn 谢晓刚工程师.主要研究方向为安全靶场、安全测评、人工智能、AI安全. xiexiaogang.hx@chinaccs.cn 汤雨婷高级工程师.主要研究方向为数据安全、AI安全、人工智能、信息安全. tangyuting.hx@chinaccs.cn

Online:2025-12-20 Published:2025-12-20

摘要/Abstract

摘要： 随着大语言模型(LLM)的广泛应用，其潜在的安全风险和伦理挑战日益显现.因此，在LLM部署前开展全面且多维度的安全评估至关重要.然而，现有评估方法缺乏系统化的安全测评框架，存在测试用例静态固化、生成耗时、覆盖率不足等局限.为应对这些问题，提出了一种自适应的大语言模型安全测评框架，具有分层、模块化和开放性架构，并开发基于大模型的自动化题库和对抗用例生成组件.测试结果表明，该框架及其组件显著提升了安全评估的全面性、时效性和准确性.

关键词: 大语言模型, 安全评估, 安全基准, 攻击提示生成, 检索增强生成

中图分类号:

TP309

陈斌, 谢晓刚, 汤雨婷, . 大语言模型自适应安全测评框架设计与开发[J]. 信息安全研究, 2025, 11(E1): 143-.

[1]	范敏, 张林波, 李展, 燕敬博, 陈亘, 刘丽丽, 董逸天, . 告警研判智能体系统研究[J]. 信息安全研究, 2025, 11(E2): 39-.
[2]	熊海洋, 苏蒙蒙, 王照, 王云, 潘晓华, 郑海斌, 陈晋音, . 大语言模型安全评测与评价体系研究[J]. 信息安全研究, 2025, 11(E2): 89-.
[3]	陈彬, 徐欢, 杜浩文, 农彩勤, 谢娇, 刘雪花, . 大模型在电力系统数据安全风险管理中的应用研究[J]. 信息安全研究, 2025, 11(E2): 100-.
[4]	于洋, 李超, 张晓京, 王琼, 张湘海, 胡振凤, . 基于大语言模型的Overlay网络配置优化方案和实现机制[J]. 信息安全研究, 2025, 11(E2): 112-.
[5]	郭富民, 毛洪亮, 杨菁林, 莫荻, 潘彭丹, . 面向大语言模型的安全测试提示词生成方法[J]. 信息安全研究, 2025, 11(E2): 136-.
[6]	李永刚, 杨宇波, 潘善民, . 基于大模型驱动的自动化漏洞挖掘系统研究[J]. 信息安全研究, 2025, 11(E2): 154-.
[7]	吴威, 周巴特尔, 马远声, 包玉洁, 魏星, . 基于大模型构建的电子数据取证人工智能知识引擎[J]. 信息安全研究, 2025, 11(E2): 295-.
[8]	冯磊, 洪晔, 秦永亮, 黄小凯, . 大语言模型安全评估技术在新型电力系统中的应用思考[J]. 信息安全研究, 2025, 11(E1): 5-.
[9]	曹文斌, 姜国庆, . 基于特征提示的大语言模型判决文书信息要素抽取[J]. 信息安全研究, 2025, 11(E1): 102-.
[10]	马宁, 张寒雪, 刘继涛, . 基于大语言模型的智能自动化安全运营体系建设研究[J]. 信息安全研究, 2025, 11(E1): 240-.
[11]	赵惠浞, 王智民, 韩剑飞, 苏凯旋, . 与大语言模型交互的API安全网关设计[J]. 信息安全研究, 2025, 11(E1): 248-.
[12]	范敏, 李艳霞, 胡星高, 曾助予, 陈亘, 卞超轶, 郭春梅, . 基于大语言模型的Bash命令注入攻击检测系统研究[J]. 信息安全研究, 2024, 10(E2): 27-.
[13]	高康, 汤博文, 金建栋, 赖清楠, 周昌令, . 基于检索增强生成的智能渗透测试方法研究[J]. 信息安全研究, 2024, 10(E2): 32-.
[14]	陈继智, 万朝华, 张斯威, . 基于大语言模型的零样本安全知识抽取方法[J]. 信息安全研究, 2024, 10(E2): 59-.
[15]	苏艳芳, 袁静, 薛俊民, . 大模型安全评估体系框架研究[J]. 信息安全研究, 2024, 10(E2): 105-.

大语言模型自适应安全测评框架设计与开发

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics