谷歌 DeepMind 推出人耳无法察觉的 AI 音频水印技术 SynthID

Google DeepMind 的 AI Lyria 模型创建的音频，包括使用 YouTube 新音频生成功能制作的曲目，将使用 SynthID 水印标记，以便人们在事后识别它们的 AI 生成来源。

在一篇博客文章中，DeepMind 表示这种水印人耳不会察觉，并且「不会损害听觉体验」，并补充说即使音频轨道被压缩、加速或减速，或者添加了额外噪音，水印仍应可被检测到。

像 SynthID 这样的水印工具被视为防范生成式 AI 带来某些危害的重要保障。例如，美国总统乔·拜登关于人工智能的行政命令呼吁制定一套由政府主导的 AI 生成内容水印标准。这是一个有前景的领域，但当前技术远非防御伪造品的万能解决方案。

根据 DeepMind 的说法，SynthID 的音频实现方式是「将音频波转换为二维可视化，显示声音中频谱随时间的演变。」它声称这种方法「与今天存在的任何东西都不同。」

Google 在 AI 生成音频中嵌入水印功能的消息发布仅几个月后，该公司就在 Google Cloud 的 Vertex AI 上为 Imagen 创建的图像发布了 SynthID 的测试版。这种水印能够抵抗剪裁或调整大小等编辑操作，尽管 DeepMind 警告说它不是对「极端图像操作」的万无一失的防御。

一起学习网

谷歌 DeepMind 推出人耳无法察觉的 AI 音频水印技术 SynthID