信息安全研究 ›› 2024, Vol. 10 ›› Issue (E2): 59-.

• 第39次全国计算机安全学术交流会入选论文 • 上一篇    下一篇

 基于大语言模型的零样本安全知识抽取方法

陈继智万朝华张斯威   

  1. (山石网科通信技术股份有限公司江苏苏州215153)
  • 出版日期:2024-11-22 发布日期:2024-11-23
  • 通讯作者: 陈继智 博士,工程师.主要研究方向为人工智能应用. jzchen@Hillstonenet.com
  • 作者简介:陈继智 博士,工程师.主要研究方向为人工智能应用. jzchen@Hillstonenet.com 万朝华 工程师.主要研究方向为网络信息安全、防火墙、入侵检测、漏洞扫描. chwan@Hillstonenet.com 张斯威 工程师.主要研究方向为网络安全、终端行为检测、Web攻击检测. swzhang@Hillstonenet.com

  • Online:2024-11-22 Published:2024-11-23

摘要: 网络威胁情报(cyber threat intelligence, CTI)报告是了解和应对网络威胁的重要资源.然而,从报告中提取信息是一个巨大挑战,因为其中包含了各种多样且复杂的实体和关系.虽然当前先进的模型在特定提取领域展现出卓越潜力,但它们通常需要大量的训练数据.提出了一种零样本信息提取方法ChatTKG,利用大语言模型(large language model, LLM)从CTI报告中提取知识.通过与LLM进行交互式对话,使用预定义的提示和模板,ChatTKG几乎无需训练过程就可以抽取符合结构化威胁信息表达(structured threat information expression, STIX)标准的安全知识,并且支持MITRE上12种战术和700多种技术的识别抽取.在公开数据集上的实验结果显示,ChatTKG取得了显著的效果,甚至超越了某些全量学习模型.

关键词: STIX, 大语言模型, CTI, 零样本学习, 信息抽取

中图分类号: