司法大模型细粒度能力测评体系构建研究

信息安全研究 ›› 2025, Vol. 11 ›› Issue (E2): 167-.

• 2025“数字经济与网络安全”论文集 • 上一篇下一篇

司法大模型细粒度能力测评体系构建研究

刘静王勇王雪

```
公安部第三研究所上海200031
```

出版日期:2025-12-27 发布日期:2025-12-29
通讯作者: 刘静硕士，研究实习员.主要研究方向为大模型、网络安全等级保护. lj234894588@163.com
作者简介:刘静硕士，研究实习员.主要研究方向为大模型、网络安全等级保护. lj234894588@163.com 王勇助理研究员.主要研究方向为网络安全、数据安全、供应链安全. wangyong@gass.ac.cn 王雪硕士，研究实习员.主要研究方向为网络安全，数据安全、供应链安全. wangxue@gass.ac.cn

Online:2025-12-27 Published:2025-12-29

摘要/Abstract

摘要： 提出一种层级化司法大模型能力测评框架，从知识能力、理解能力、推理能力、内容生成能力4个核心维度出发，构建细化的三级指标体系.通过设计差异化权重的选择题、填空题、论述题3类题型，实现对司法大模型能力的量化评分，并采用层级加权法计算模型综合得分.该体系能有效揭示司法大模型能力差异，填补司法大模型能力评估空白，为模型优化与应用场景匹配提供理论依据.

关键词: 大模型, 能力测评, 模型优化, 层级加权法

中图分类号:

TP309

刘静, 王勇, 王雪, . 司法大模型细粒度能力测评体系构建研究[J]. 信息安全研究, 2025, 11(E2): 167-.

[1]	李越挺, 江魁, . 基于LLMRAG的可信恶意URL识别方法[J]. 信息安全研究, 2025, 11(E2): 19-.
[2]	刘楠, 陶源, . 基于多任务场景的大模型网络安全等级保护知识增强方法[J]. 信息安全研究, 2025, 11(E2): 67-.
[3]	吴金宇, 张富川, 胡海生, 江泽铭, 陈树廷, 段古纳, 刘丹, 齐洪东, 杜君, . 可信计算3.0在新型电力系统AI大模型安全防护中的增强机制及应用[J]. 信息安全研究, 2025, 11(E2): 85-.
[4]	马霄, 张瑞恒, 董保开, 金忠龙, 宋锐, 王峰, 刘超, . 工业大模型内生安全风险与防护体系研究[J]. 信息安全研究, 2025, 11(E2): 94-.
[5]	曹思玮, 陈广勇, . 大模型攻击技术综述[J]. 信息安全研究, 2025, 11(E2): 116-.
[6]	刘瑞, 吴强, 陈佳珵, . 能源化工行业基于联邦学习技术的大模型建设研究[J]. 信息安全研究, 2025, 11(E2): 146-.
[7]	汤志伟, 罗佳莹, 俞贵琪, . 大模型安全测评评估框架研究[J]. 信息安全研究, 2025, 11(E2): 267-.
[8]	李文瑾, 祝荣吉, 骆嘉敏, 高东, 范敦球, . 从AI红队视角分析大模型安全威胁[J]. 信息安全研究, 2025, 11(E2): 299-.
[9]	熊开智, 叶马力, 岳攀, 卢嘉源, . 基于大模型的多模态攻防检测自动化编排控制系统[J]. 信息安全研究, 2025, 11(E1): 72-.
[10]	郝伟, . 人工智能大模型安全评测与评价体系研究[J]. 信息安全研究, 2025, 11(E1): 163-.
[11]	宋歌, . 基于AI的代码安全检测技术探索与实践[J]. 信息安全研究, 2025, 11(E1): 181-.
[12]	张星, . 医疗大模型数据安全保障技术及应用研究[J]. 信息安全研究, 2025, 11(E1): 229-.
[13]	李守伟, 张嘉政, 何海波, 陈明辉, . 基于区块链的大模型数据监管体系设计[J]. 信息安全研究, 2025, 11(8): 682-.
[14]	魏政, 何树果, 程度, 仇晶, 庞博文, 邢亚君, 郭媛, . 基于语义复原和大模型的无文件混淆攻击识别[J]. 信息安全研究, 2025, 11(12): 1125-.
[15]	韦韬, 仲震宇, 刘焱, 陈达, 薛见新, 胡钺琳, 余超凡, 周云浩, . 大模型驱动的高阶程序[J]. 信息安全研究, 2025, 11(11): 1008-.

司法大模型细粒度能力测评体系构建研究

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics