信息安全研究 ›› 2024, Vol. 10 ›› Issue (E1): 83-.

• 《全球人工智能治理倡议》分析与解读 • 上一篇    下一篇

面向生成式人工智能(大语言模型)深度合成内容鉴定技术的研究

陈谌   

  1. (杭州网易智企科技有限公司杭州310056)
  • 出版日期:2024-07-14 发布日期:2024-07-28
  • 通讯作者: 陈谌 网易易盾AIGC内容风控业务负责人.主要研究方向为人工智能内容安全与风险评估. chenchen38@corp.netease.com
  • 作者简介:陈谌 网易易盾AIGC内容风控业务负责人.主要研究方向为人工智能内容安全与风险评估. chenchen38@corp.netease.com

  • Online:2024-07-14 Published:2024-07-28

摘要: 基于深度合成技术的发展,国内基于生成式人工智能(大语言模型)生成的内容日益增多,这对内容风险控制提出了新的挑战.提出了一种基于域泛化的多维度算法匹配的方式,快速低成本地构建大模型内容风控体系,旨在有效防范深度合成内容、进行内容正负向鉴定,并准确抓取识别内容中的敏感特征.该体系通过融合多种机器学习算法和自然语言处理技术,实现了对生成式人工智能(大语言模型)输入输出过程的全面风险评估,并针对性地建立保障体系.

关键词: 域泛化, 深度合成, 正负向判定, 敏感特征识别