SynthID:谷歌如何保护AI信息的真实性

在当前互联网充斥着AI生成内容的时代,内容的直接生产者和创越来越难以保持其作品的真实性和完整性。在现代数字时代,区分人类生成内容和AI生成内容变得至关重要,以维护信任和人类劳动的价值。因此,SynthID——世界上第一个标记和识别AI生成内容的工具应运而生。目前,这个革命性的工具正处于测试阶段。它通过在不同媒体类型中嵌入数字水印,确保AI生成的图像、音频、文本和视觉内容能够被轻松且无风险地识别。

SynthID是什么?

在2024年I/O大会上,谷歌展示了SynthID的扩展,这是一种设计用于认证由AI生成的合成图像的数字水印。这项谷歌DeepMind技术将被集成到他们最新的视频生成工具——Gemini应用和网页界面中。SynthID旨在通过提供一种可靠的方法来区分真实和AI生成内容,从而保护用户免受虚假信息的侵害。

SynthID旨在对由AI创建的图像进行水印标记和识别。这项创新技术在AI生成内容的像素中嵌入了一个不可见的数字水印,确保水印对肉眼不可见,但可以通过特定的扫描方法检测到。通过检查图像中的这个独特数字签名,SynthID可以确定图像是否由AI生成,从而帮助验证数字图像的来源。

识别AI生成内容的重要性

SynthID解决了数字领域中的一个关键需求:识别AI生成内容的能力。虽然它不是解决虚假信息或错误归属的万能药,但SynthID代表了AI安全性向前迈出的重要一步。使AI生成内容可追溯,促进了透明度和信任,帮助用户和组织负责任地与AI技术互动。

SynthID的工作原理

SynthID使用先进的深度学习模型和算法,在不同媒体类型中嵌入和检测数字水印:

  • 水印:数字水印直接嵌入到AI生成内容中,而不改变其原始质量。
  • 识别:SynthID扫描媒体中的这些水印,允许用户验证内容是否由谷歌的AI工具生成。

水印处理过程

一个大型语言模型(LLM)一次生成一个标记。标记可以代表一个字符、一个词或短语的一部分。为了创建一个连贯的文本序列,模型根据前面的词和分配给每个潜在标记的概率分数预测下一个最可能的标记。

在不会影响输出质量、准确性和创造性的情况下,SynthID调整每个预测标记的概率分数。这个过程在整个生成的文本中重复,嵌入一个可以被SynthID检测到的水印模式。下面的部分将涵盖SynthID在文本、图像和视频中的应用。

SynthID在文本中的应用

SynthID的文本水印功能集成到了Gemini应用和网页体验中。这种方法将水印嵌入到大型语言模型(LLM)的文本生成过程中,这些模型预测序列中的下一个标记(字符、词或短语的一部分)。SynthID可以在不牺牲文本质量或创造性的情况下进行水印处理,通过微妙地调整标记概率分数。这种方法对各种文本长度都有效,并且在轻微变换如改写下仍然保持强大。

SynthID在音乐和音频中的应用

2023年11月,SynthID扩展到包括AI生成的音乐和音频,首先通过Lyria模型部署。水印处理过程涉及将音频波形转换为频谱图,嵌入水印,然后再转换回来。这种技术确保水印在听觉上不可见,并且能够抵抗常见的音频修改,如压缩或速度变化。

SynthID在图像和视频中的应用

SynthID的图像和视频水印涉及直接将水印嵌入像素和视频帧中。这种方法在保持媒体质量的同时,允许水印在修改如裁剪或压缩后仍然可以被检测到。SynthID工具的功能与Vertex AI的文本到图像模型和Veo视频生成模型集成,便于无缝识别AI生成内容。

可用性和集成

SynthID技术可供Vertex AI客户使用,并已集成到ImageFX和VideoFX等产品中。用户可以通过谷歌搜索和Chrome中的功能识别AI生成内容,促进这项技术的广泛使用和可访问性。

还已将SynthID集成到Veo中,Veo是迄今为止功能最强大的视频生成模型,可供VideoFX上的选定创使用。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485