一起学习网 一起学习网

谷歌 DeepMind 推出人耳无法察觉的 AI 音频水印技术 SynthID

Google DeepMind 的 AI Lyria 模型创建的音频,包括使用 YouTube 新音频生成功能制作的曲目,将使用 SynthID 水印标记,以便人们在事后识别它们的 AI 生成来源。

在一篇博客文章中,DeepMind 表示这种水印人耳不会察觉,并且「不会损害听觉体验」,并补充说即使音频轨道被压缩、加速或减速,或者添加了额外噪音,水印仍应可被检测到

像 SynthID 这样的水印工具被视为防范生成式 AI 带来某些危害的重要保障。例如,美国总统乔·拜登关于人工智能的行政命令呼吁制定一套由政府主导的 AI 生成内容水印标准。这是一个有前景的领域,但当前技术远非防御伪造品的万能解决方案。

根据 DeepMind 的说法,SynthID 的音频实现方式是「将音频波转换为二维可视化,显示声音中频谱随时间的演变。」它声称这种方法「与今天存在的任何东西都不同。」

Google 在 AI 生成音频中嵌入水印功能的消息发布仅几个月后,该公司就在 Google Cloud 的 Vertex AI 上为 Imagen 创建的图像发布了 SynthID 的测试版。这种水印能够抵抗剪裁或调整大小等编辑操作,尽管 DeepMind 警告说它不是对「极端图像操作」的万无一失的防御。