Google DeepMind 为 AI 大模型添加“隐形指纹”- 大数跨境

首页

Google DeepMind 为 AI 大模型添加“隐形指纹”

元龙数字智能科技

2024-11-01

Google DeepMind

隐形指纹

Google DeepMind

为 AI 大模型添加“隐形指纹”

2024 年，生成式人工智能正深刻改变全球内容生产格局，但也带来严峻挑战，尤其是如何识别和防止 AI 生成内容被滥用。Google DeepMind 团队为此推出重磅研究成果——SynthID-Text 新型水印工具。

该工具采用“锦标赛抽样”算法，在不损害文本质量前提下嵌入隐形水印，使大语言模型生成的文本带有独特标识，提高了文本追踪和检测精度。相关论文以封面文章形式发表在《Nature》上，标志着 AI 文本透明性和责任性的重大进展。

大语言模型技术发展

GPT 系列模型

随着大语言模型技术发展，如 GPT 系列模型生成的文本流畅度和语言多样性接近甚至超越人类。然而，这也带来内容可信性和来源问题挑战，特别是在教育、媒体等领域，无法辨别来源可能导致误导性信息传播。

大语言模型将文本分解为 token，逐步预测下一个 token 出现概率，通过大量语料训练学习语言上下文结构实现生成。传统水印技术往往需在生成文本中做可察觉修改，检测效果欠佳且误报率高，还存在隐私问题。

SynthID-Text 的创新在于引入随机种子生成器和多层次水印函数。在生成 token 时，随机种子传递给多个水印函数，通过锦标赛方式选出符合水印要求的最高分词嵌入文本，确保生成文本具水印特征且不影响流畅性和多样性。

嵌入技术

其嵌入技术分为三个关键步骤：随机种子生成，输入上下文后生成种子作为后续输入；锦标赛抽样，随机种子传递给多层次水印函数，系统通过比较选出得分最高的词嵌入；水印嵌入，选择符合水印条件的词且不偏离原语言模型分布。

在生成式 AI 应用中，文本质量和多样性至关重要。传统水印技术常牺牲文本流畅性，SynthID-Text 则通过非扭曲水印技术优化，兼顾文本质量和透明性。研究表明，单词级别水印嵌入不改变原文本生成分布，保持了流畅性和多样性。

研究团队对 2000 万条大语言模型生成的文本进行实验，发现非失真模式下几乎不影响文本质量，用户满意度差异仅 0.01%。论文还分析了“单 token 非失真性”，保证文本质量最大程度保留。

水印检测性能受文本长度和熵值影响，熵值高则水印嵌入和检测效果好，低则难度增加。研究团队提出增加锦标赛层数提高低熵环境下检测性能，但警告层数过多可能削弱水印嵌入效果，建议控制在 30 层以内以平衡检测精度与文本生成。

提高鲁棒性

尽管SynthID-Text 有显著优势，但也存在局限性。在加速文本生成应用方面，尚未对推测性抽样等技术优化；文本可能被重写或编辑规避水印，需结合其他检测技术提高鲁棒性；多语言模型兼容性方面，当前主要针对英语文本，不同语言效果可能有差异。

研究团队计划未来将水印算法与其他文本生成加速技术结合，提升效率与精度，并深入研究不同熵值下水印表现以扩展应用场景。

此外，SynthID 不止用于文字，还能为音频、图像和视频添加水印。在人工智能生成音乐方面，将音频波转换为光谱图添加水印后不影响聆听体验；在图像和视频方面，直接添加人眼无法察觉的水印且不影响质量，即使经过多种修改仍可检测。

Google DeepMind 开源代码，让更多人使用该工具确定文本输出是否来自自己的大语言模型，构建可信 AI。随着生成式 AI 技术普及，信息透明性和追踪性至关重要。SynthID 的推出为生成式 AI 文本溯源和透明化提供解决方案，也为应对虚假信息扩散提供新思路。Gartner 预测，到 2028 年超 50%企业将采用应对虚假信息的产品和技术，目前比例不到 5%。未来，SynthID 或将为各行业提供保障，在信息泛滥中保持信任和透明。

END

期待您与元龙科技携手共创未来

【声明】内容源于网络

元龙数字智能科技

永做第一使命第一向善第一

内容 901

粉丝 0

元龙数字智能科技永做第一使命第一向善第一

总阅读2.5k

粉丝0

内容901