人工智能大模型安全评测与评价体系研究

信息安全研究 ›› 2025, Vol. 11 ›› Issue (E1): 163-.

• 2025网络安全创新发展大会入选论文 • 上一篇下一篇

人工智能大模型安全评测与评价体系研究

郝伟

(北京轩宇信息技术有限公司北京100190)

出版日期:2025-12-20 发布日期:2025-12-20
通讯作者: 郝伟硕士，高级工程师.主要研究方向为软件测试、软件工程. h82425_iph@163.com
作者简介:郝伟硕士，高级工程师.主要研究方向为软件测试、软件工程. h82425_iph@163.com

Online:2025-12-20 Published:2025-12-20

摘要/Abstract

摘要： 随着人工智能技术的迅猛发展，大规模预训练模型(以下简称“大模型”)在自然语言处理、计算机视觉等领域展现出强大的通用性与适应性.然而，大模型在实际应用中也面临着数据偏见、对抗攻击、隐私泄露以及算法伦理等方面的问题.为了使大模型能够更好地在社会和工业领域发挥作用，必须建立一套系统、科学且可操作的安全评测与评价体系.在梳理国内外相关研究的基础上，探讨了大模型安全面临的主要挑战，深入分析了可解释性、安全性与公平性等评估维度，并提出了相应的评价指标与方法.

关键词: 人工智能, 大模型, 安全评测, 评价体系, 公平性

中图分类号:

TP309

郝伟, . 人工智能大模型安全评测与评价体系研究[J]. 信息安全研究, 2025, 11(E1): 163-.

[1]	李越挺, 江魁, . 基于LLMRAG的可信恶意URL识别方法[J]. 信息安全研究, 2025, 11(E2): 19-.
[2]	张春晖, 李剑, 杨榆, 秦素娟, 邹仕洪, . 基于LSTM的异常攻击检测在人工智能安全实践教育中的研究[J]. 信息安全研究, 2025, 11(E2): 53-.
[3]	刘艳婷, 王晶萍, 鲁学亮, 龙海明, . 基于分层递进的教育数据治理与安全防护模型[J]. 信息安全研究, 2025, 11(E2): 58-.
[4]	刘楠, 陶源, . 基于多任务场景的大模型网络安全等级保护知识增强方法[J]. 信息安全研究, 2025, 11(E2): 67-.
[5]	吴金宇, 张富川, 胡海生, 江泽铭, 陈树廷, 段古纳, 刘丹, 齐洪东, 杜君, . 可信计算3.0在新型电力系统AI大模型安全防护中的增强机制及应用[J]. 信息安全研究, 2025, 11(E2): 85-.
[6]	熊海洋, 苏蒙蒙, 王照, 王云, 潘晓华, 郑海斌, 陈晋音, . 大语言模型安全评测与评价体系研究[J]. 信息安全研究, 2025, 11(E2): 89-.
[7]	马霄, 张瑞恒, 董保开, 金忠龙, 宋锐, 王峰, 刘超, . 工业大模型内生安全风险与防护体系研究[J]. 信息安全研究, 2025, 11(E2): 94-.
[8]	陈彬, 徐欢, 杜浩文, 农彩勤, 谢娇, 刘雪花, . 大模型在电力系统数据安全风险管理中的应用研究[J]. 信息安全研究, 2025, 11(E2): 100-.
[9]	杜浩文, 陈彬, 刘家豪, 徐欢, 陈锋, 刘雪花, . 基于深度学习算法构建智能化数据分类分级系统[J]. 信息安全研究, 2025, 11(E2): 104-.
[10]	徐欢, 陈彬, 杜浩文, 刘家豪, 陈锋, 郝志婧, . 基于人工智能的电力行业数据安全运营实践研究[J]. 信息安全研究, 2025, 11(E2): 107-.
[11]	曹思玮, 陈广勇, . 大模型攻击技术综述[J]. 信息安全研究, 2025, 11(E2): 116-.
[12]	霍军, 朱广劼, . 铁路网络安全防御机制探讨[J]. 信息安全研究, 2025, 11(E2): 120-.
[13]	曹志威, 黄俊, 王炳懿, 欧崇阳, . 影像医学与人工智能融合的教学体系构建及平台应用研究[J]. 信息安全研究, 2025, 11(E2): 123-.
[14]	朱丽, 李万青, 何平, 高巍, 刘左恒, . 数字社会背景下的数据安全威胁及应对策略[J]. 信息安全研究, 2025, 11(E2): 141-.
[15]	刘瑞, 吴强, 陈佳珵, . 能源化工行业基于联邦学习技术的大模型建设研究[J]. 信息安全研究, 2025, 11(E2): 146-.

人工智能大模型安全评测与评价体系研究

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics