推进内容来源验证,构建更安全透明的AI生态系统

TL;DR · AI 摘要
OpenAI发布内容来源验证新举措,通过C2PA合规认证、与Google SynthID合作的水印技术以及公开验证工具,构建多层次防篡改的内容溯源体系,提升AI生成内容的可信度和透明度。
核心要点
- OpenAI已成为C2PA合规生成产品,平台可读取和传递其内容来源信息
- 通过Google DeepMind的SynthID为ChatGPT/API/Codex生成的图像添加隐形水印作为元数据的补充层
- 推出公开验证工具,用户可上传图片检测是否来自OpenAI的生成系统
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- OpenAI内容来源验证体系
- C2PA合规认证
- 加入C2PA联盟指导委员会
- 元数据+加密签名技术
- DALL·E 3/ImageGen/Sora已应用
- SynthID水印技术
- Google DeepMind合作
- 隐形水印层
- 抗截图等转换
- 公开验证工具
- 检测图像来源
- 支持ChatGPT/API/Codex
金句 / Highlights
值得收藏与分享的关键句。
来源验证信号帮助人们了解内容的来源、创建或编辑方式,以及内容是否与其声称的一致。
通过C2PA合规认证,我们为平台提供了可信赖的方式来读取、保存和传递我们附加在内容上的来源信息。
SynthID嵌入隐形水印层作为C2PA元数据方案的补充,使来源验证在元数据丢失时仍更可靠。
两者结合使来源验证比单独任何一层都更具韧性。
人们每天都在使用 OpenAI 的工具来创建和编辑图像和音频,使交流变得更加生动、有用和便捷。随着这些工具成为人们构建、想象和分享的一部分,让人们能够理解和验证媒体的来源变得非常重要,这样他们才能更有信心地解读内容。来源信号可以通过提供内容的来源、创建或编辑方式以及其是否与声称的内容相符等背景信息来提供帮助。
今天,我们正在通过一个多层级的、生态系统驱动的方法来加强我们的内容来源认证方法,以建立在线信任。我们正在通过 C2PA 合规性使我们的来源信号更容易被其他工具和平台识别,通过与 Google 的合作为图像添加持久的跨平台 SynthID 水印,并分享一个工具的预览,供公众用来验证图像是否来自 OpenAI。
这些更新建立在我们早期的工作基础之上,旨在支持开放标准、识别 OpenAI 生成的内容,以及与行业合作支持更可信的信息生态系统。
通过 C2PA 合规性构建信任生态系统
自 2024 年以来,OpenAI 一直致力于来源标准的开发和推广,当时我们开始为 DALL·E 3 生成的图像添加内容凭证,后来又扩展到 ImageGen 和 Sora。我们还加入了内容来源和真实性联盟(C2PA)的指导委员会,这是内容来源开放技术标准背后的跨行业组织。C2PA 的技术方法使用元数据和加密签名,帮助媒体信息随内容本身安全传播。这些信息包括帮助记者评估来源的平台、做出完整性决策的以及人们试图理解网上所见内容的背景信息。
我们最近采取了将 OpenAI 打造为 C2PA 合规生成器产品的步骤。通过实现 C2PA 合规性,我们为平台提供了一种可信赖的方式来读取、保留和传递我们附加到内容中的来源信息。这一点很重要,因为来源信息只有在超越创建内容的第一个平台时才能发挥作用,而合规性使这成为可能。
通过 Google SynthID 实现多层来源认证方法
C2PA 元数据是来源认证的重要基础。它帮助内容携带关于其来源、创建或编辑方式以及信息签署者的信息。但元数据并非万无一失。它可能在上传和下载过程中被剥离、丢失,或因文件格式更改、调整大小或截图等转换而被破坏。
为了提高来源认证的韧性,我们正在采用多层方法,并通过 Google DeepMind 的 SynthID 引入水印技术,首先应用于通过 ChatGPT、Codex 或 OpenAI API 生成的图像。SynthID 嵌入了一个不可见的水印层,补充了基于 C2PA 元数据的方法。
我们朝着这个方向已经建设了一段时间。我们在 Sora 中使用了可见水印,在 Voice Engine 中使用了音频水印,并持续测试和研究其准确性和可靠性。
这两个系统相互强化。C2PA 帮助内容携带详细背景信息;SynthID 帮助在元数据无法保留时保持信号。水印可以通过截图等转换保持更持久的韧性,而元数据可以提供比单独水印更多的信息 Together,它们使来源认证比任何单一层都更具韧性。
检测和公共验证工具的预览
可信的元数据和能抵抗大多数修改的水印可以使来源信号更加持久。但人们需要一种方法来检测这些信号。我们现在正在预览一个公共验证工具,它将帮助人们验证上传的图像是否通过 ChatGPT、OpenAI API 或 Codex 生成,通过检查是否包含来源信号,包括内容凭证和 SynthID。
我们相信来源认证应该更容易让人们验证和解释,我们的工具可以通过整合多个信号来帮助人们回答"这是用 AI 生成的吗?"这个问题。这建立在 2024 年我们图像检测分类器初始研究预览的经验基础上,使人们能够可靠地检测媒体中是否存在来自 OpenAI 的 SynthID 水印,并在发现时显示 C2PA 元数据。

没有一种检测方法是完美无缺的,因此我们在检测失败的情况下采取谨慎的态度。例如,如果未检测到元数据或水印,该工具不会对图像是否使用 OpenAI 工具生成做出确定性结论,因为来源信号在某些情况下可能被剥离。
在发布时,该工具仅限于 OpenAI 生成的内容。在接下来的几个月里,我们的目标是支持跨行业的努力,使跨平台验证成为可能。随着时间的推移,我们还希望支持更多人们可能在网上遇到的内容类型。
展望未来
单一的来源技术本身是不够的。我们相信,一个强有力的方法结合了共享标准、持久性水印信号和公开验证。通过在我们长期支持 Content Credentials 的基础上,遵守 C2PA 标准,采用 SynthID,并预览公开验证工具,我们希望长期为建设一个更具互操作性的来源生态系统做出贡献。