大语言模型插件安全性研究

信息安全研究 ›› 2024, Vol. 10 ›› Issue (E1): 196-.

大语言模型插件安全性研究

聂万泉

(杭州默安科技有限公司杭州311100)

出版日期:2024-07-14 发布日期:2024-07-26
通讯作者: 聂万泉高级工程师.主要研究方向为网络安全和人工智能安全. john.nie@firecloud.ai
作者简介:聂万泉高级工程师.主要研究方向为网络安全和人工智能安全. john.nie@firecloud.ai

Online:2024-07-14 Published:2024-07-26

摘要/Abstract

摘要： 大语言模型插件作为人工智能领域的创新，为GPT带来了新的功能和能力，使其能够与外部数据源和系统进行交互.然而，引入插件也带来了一系列安全性问题，如Markdown注入、跨插件请求伪造、代码解释器会话逃逸、恶意插件和内容安全策略绕过等.为了应对这些安全挑战，建议实施隔离插件访问、安全合同和责任界定、核心大语言模型与沙盒大语言模型双重模式、功能分离和信任数据等措施以增强安全性.

关键词: 大语言模型, 大语言模型插件, 恶意插件, GPT内容安全

中图分类号:

TP393.08

聂万泉, . 大语言模型插件安全性研究[J]. 信息安全研究, 2024, 10(E1): 196-.

[1]	潘琪亮, 李明, 皮振中, 黄利文, 方中奎, . 基于DeepSpeed框架构建信息安全领域通用人工智能模型的探索[J]. 信息安全研究, 2024, 10(E1): 155-.
[2]	刘楠, 陶源, 陈广勇, . 大语言模型在网络安全领域的应用[J]. 信息安全研究, 2024, 10(E1): 236-.
[3]	吴佩泽, 李光辉, 吴津宇, . 基于大语言模型的自动化漏洞验证代码生成方法研究[J]. 信息安全研究, 2024, 10(E1): 246-.
[4]	吴佩泽, 李光辉, 吴津宇, . 基于大语言模型的电力监控系统资产脆弱性管理技术研究[J]. 信息安全研究, 2024, 10(E1): 241-.
[5]	黄振, 单文政, 郭芙蓉, 郑剑波, 陈晏鹏, . 可信大模型政务问答系统设计与实现[J]. 信息安全研究, 2024, 10(E1): 191-.

大语言模型插件安全性研究

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 5

编辑推荐

Metrics