大数跨境

Google DeepMind 为 AI 大模型添加“隐形指纹”

Google DeepMind 为 AI 大模型添加“隐形指纹” 元龙数字智能科技
2024-11-01
2


Google DeepMind

隐形指纹

Google DeepMind 

为 AI 大模型添加“隐形指纹”


2024 年,生成式人工智能正深刻改变全球内容生产格局,但也带来严峻挑战,尤其是如何识别和防止 AI 生成内容被滥用。Google DeepMind 团队为此推出重磅研究成果——SynthID-Text 新型水印工具


该工具采用“锦标赛抽样”算法,在不损害文本质量前提下嵌入隐形水印,使大语言模型生成的文本带有独特标识,提高了文本追踪和检测精度。相关论文以封面文章形式发表在《Nature》上,标志着 AI 文本透明性和责任性的重大进展。

AI

  大语言模型技术发展



AI


GPT 系列模型

随着大语言模型技术发展,如 GPT 系列模型生成的文本流畅度和语言多样性接近甚至超越人类。然而,这也带来内容可信性和来源问题挑战,特别是在教育、媒体等领域,无法辨别来源可能导致误导性信息传播。


大语言模型将文本分解为 token,逐步预测下一个 token 出现概率,通过大量语料训练学习语言上下文结构实现生成。传统水印技术往往需在生成文本中做可察觉修改,检测效果欠佳且误报率高,还存在隐私问题。


SynthID-Text 的创新在于引入随机种子生成器和多层次水印函数。在生成 token 时,随机种子传递给多个水印函数,通过锦标赛方式选出符合水印要求的最高分词嵌入文本,确保生成文本具水印特征且不影响流畅性和多样性。



AI

嵌入技术

其嵌入技术分为三个关键步骤:随机种子生成,输入上下文后生成种子作为后续输入;锦标赛抽样,随机种子传递给多层次水印函数,系统通过比较选出得分最高的词嵌入;水印嵌入,选择符合水印条件的词且不偏离原语言模型分布。


在生成式 AI 应用中,文本质量和多样性至关重要。传统水印技术常牺牲文本流畅性,SynthID-Text 则通过非扭曲水印技术优化,兼顾文本质量和透明性。研究表明,单词级别水印嵌入不改变原文本生成分布,保持了流畅性和多样性。

研究团队对 2000 万条大语言模型生成的文本进行实验,发现非失真模式下几乎不影响文本质量,用户满意度差异仅 0.01%。论文还分析了“单 token 非失真性”,保证文本质量最大程度保留。


水印检测性能受文本长度和熵值影响,熵值高则水印嵌入和检测效果好,低则难度增加。研究团队提出增加锦标赛层数提高低熵环境下检测性能,但警告层数过多可能削弱水印嵌入效果,建议控制在 30 层以内以平衡检测精度与文本生成。


提高鲁棒性

尽管SynthID-Text 有显著优势,但也存在局限性。在加速文本生成应用方面,尚未对推测性抽样等技术优化;文本可能被重写或编辑规避水印,需结合其他检测技术提高鲁棒性;多语言模型兼容性方面,当前主要针对英语文本,不同语言效果可能有差异。

研究团队计划未来将水印算法与其他文本生成加速技术结合,提升效率与精度,并深入研究不同熵值下水印表现以扩展应用场景。

此外,SynthID 不止用于文字,还能为音频、图像和视频添加水印。在人工智能生成音乐方面,将音频波转换为光谱图添加水印后不影响聆听体验;在图像和视频方面,直接添加人眼无法察觉的水印且不影响质量,即使经过多种修改仍可检测。


Google DeepMind 开源代码,让更多人使用该工具确定文本输出是否来自自己的大语言模型,构建可信 AI。随着生成式 AI 技术普及,信息透明性和追踪性至关重要。SynthID 的推出为生成式 AI 文本溯源和透明化提供解决方案,也为应对虚假信息扩散提供新思路。Gartner 预测,到 2028 年超 50%企业将采用应对虚假信息的产品和技术,目前比例不到 5%。未来,SynthID 或将为各行业提供保障,在信息泛滥中保持信任和透明。



END 






期待您与元龙科技携手共创未来




【声明】内容源于网络
0
0
元龙数字智能科技
永做第一 使命第一 向善第一
内容 901
粉丝 0
元龙数字智能科技 永做第一 使命第一 向善第一
总阅读2.5k
粉丝0
内容901