信息安全研究 ›› 2025, Vol. 11 ›› Issue (E2): 167-.

• 2025“数字经济与网络安全”论文集 • 上一篇    下一篇

司法大模型细粒度能力测评体系构建研究

刘静王勇王雪
  

  1. 公安部第三研究所上海200031
  • 出版日期:2025-12-27 发布日期:2025-12-29
  • 通讯作者: 刘静 硕士,研究实习员.主要研究方向为大模型、网络安全等级保护. lj234894588@163.com
  • 作者简介:刘静 硕士,研究实习员.主要研究方向为大模型、网络安全等级保护. lj234894588@163.com 王勇 助理研究员.主要研究方向为网络安全、数据安全、供应链安全. wangyong@gass.ac.cn 王雪 硕士,研究实习员.主要研究方向为网络安全,数据安全、供应链安全. wangxue@gass.ac.cn

  • Online:2025-12-27 Published:2025-12-29

摘要: 提出一种层级化司法大模型能力测评框架,从知识能力、理解能力、推理能力、内容生成能力4个核心维度出发,构建细化的三级指标体系.通过设计差异化权重的选择题、填空题、论述题3类题型,实现对司法大模型能力的量化评分,并采用层级加权法计算模型综合得分.该体系能有效揭示司法大模型能力差异,填补司法大模型能力评估空白,为模型优化与应用场景匹配提供理论依据.

关键词: 大模型, 能力测评, 模型优化, 层级加权法

中图分类号: