面向生成式人工智能(大语言模型)深度合成内容鉴定技术的研究

信息安全研究 ›› 2024, Vol. 10 ›› Issue (E1): 83-.

• 《全球人工智能治理倡议》分析与解读 • 上一篇下一篇

面向生成式人工智能(大语言模型)深度合成内容鉴定技术的研究

陈谌

(杭州网易智企科技有限公司杭州310056)

出版日期:2024-07-14 发布日期:2024-07-28
通讯作者: 陈谌网易易盾AIGC内容风控业务负责人.主要研究方向为人工智能内容安全与风险评估. chenchen38@corp.netease.com
作者简介:陈谌网易易盾AIGC内容风控业务负责人.主要研究方向为人工智能内容安全与风险评估. chenchen38@corp.netease.com

Online:2024-07-14 Published:2024-07-28

摘要/Abstract

摘要： 基于深度合成技术的发展，国内基于生成式人工智能(大语言模型)生成的内容日益增多，这对内容风险控制提出了新的挑战.提出了一种基于域泛化的多维度算法匹配的方式，快速低成本地构建大模型内容风控体系，旨在有效防范深度合成内容、进行内容正负向鉴定，并准确抓取识别内容中的敏感特征.该体系通过融合多种机器学习算法和自然语言处理技术，实现了对生成式人工智能(大语言模型)输入输出过程的全面风险评估，并针对性地建立保障体系.

关键词: 域泛化, 深度合成, 正负向判定, 敏感特征识别

陈谌, . 面向生成式人工智能(大语言模型)深度合成内容鉴定技术的研究[J]. 信息安全研究, 2024, 10(E1): 83-.

面向生成式人工智能(大语言模型)深度合成内容鉴定技术的研究

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 0

编辑推荐

Metrics