信息安全研究 ›› 2025, Vol. 11 ›› Issue (E1): 163-.

• 2025网络安全创新发展大会入选论文 • 上一篇    下一篇

人工智能大模型安全评测与评价体系研究

郝伟   

  1. (北京轩宇信息技术有限公司北京100190)
  • 出版日期:2025-12-20 发布日期:2025-12-20
  • 通讯作者: 郝伟 硕士,高级工程师.主要研究方向为软件测试、软件工程. h82425_iph@163.com
  • 作者简介:郝伟 硕士,高级工程师.主要研究方向为软件测试、软件工程. h82425_iph@163.com

  • Online:2025-12-20 Published:2025-12-20

摘要: 随着人工智能技术的迅猛发展,大规模预训练模型(以下简称“大模型”)在自然语言处理、计算机视觉等领域展现出强大的通用性与适应性.然而,大模型在实际应用中也面临着数据偏见、对抗攻击、隐私泄露以及算法伦理等方面的问题.为了使大模型能够更好地在社会和工业领域发挥作用,必须建立一套系统、科学且可操作的安全评测与评价体系.在梳理国内外相关研究的基础上,探讨了大模型安全面临的主要挑战,深入分析了可解释性、安全性与公平性等评估维度,并提出了相应的评价指标与方法.

关键词: 人工智能, 大模型, 安全评测, 评价体系, 公平性

中图分类号: