Anthropic Offers Mythos Upgrade for Cyber Partners and a ‘Safe’ Version for the Rest of You

TL;DR · AI 摘要
Anthropic 推出 Claude Fable 5 和 Claude Mythos 5 两个版本,前者限制敏感领域使用,后者仅向特定合作伙伴开放。
核心要点
- Claude Fable 5 限制用户提问涉及网络安全、生物学和化学的问题。
- Claude Mythos 5 仅向特定合作伙伴和生物学家开放。
- Anthropic 通过限制访问和使用来降低模型被用于恶意目的的风险。
结构提纲
按章节快速跳转。
- §引言
Anthropic 推出两个新模型,分别面向合作伙伴和公众。
- ·模型发布
Claude Fable 5 和 Claude Mythos 5 是 Anthropic 新发布的两个 AI 模型。
- ›模型限制
Claude Fable 5 限制用户提问涉及网络安全、生物学和化学的问题。
Anthropic 正与美国政府合作,向特定合作伙伴提供 Claude Mythos 5。
- ›未来计划
Anthropic 计划在未来扩大 Claude Mythos 5 的访问范围。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Anthropic 推出新模型
- Claude Fable 5
- 限制领域:网络安全、生物学、化学
- 使用旧模型 Claude Opus 4.8 处理敏感请求
- Claude Mythos 5
- 仅向特定合作伙伴和生物学家开放
- 与美国政府合作
金句 / Highlights
值得收藏与分享的关键句。
Claude Fable 5 限制用户提问涉及网络安全、生物学和化学的问题。
Claude Mythos 5 仅向特定合作伙伴和生物学家开放。
Anthropic 通过限制访问和使用来降低模型被用于恶意目的的风险。
Anthropic 为网络安全合作伙伴提供 Mythos 升级版,其余用户则提供“安全”版本 | WIRED
Maxwell Zeff
Lily Hay Newman
商业
2026年6月9日 下午1:00
Anthropic 为网络安全合作伙伴提供 Mythos 升级版,其余用户则提供“安全”版本
Anthropic 正向受信任的组织推出 Claude Mythos 5,同时向公众推出 Claude Fable 5,称后者无法用于网络攻击。
Anthropic 首席执行官 Dario Amodei。
照片:Ludovic Marin/Getty Images
保存此故事
Anthropic 于周二发布了两款新的 AI 模型,分别名为 Claude Fable 5 和 Claude Mythos 5,公司表示,这两款模型的能力比其在四月向有限数量的科技行业合作伙伴发布的 Mythos Preview 模型更强。Anthropic 曾表示,最初的有限发布源于担忧,该模型的能力可能被恶意行为者利用,开发出能出其不意地攻击防御者的黑客工具。
目前,Anthropic 仅向有限数量的行业合作伙伴发布 Claude Mythos 5,其中许多合作伙伴曾获得 Mythos Preview 的访问权限,公司表示,它正在与美国政府合作推进发布。
Claude Fable 5 是公开发布的版本,使用与 Mythos 5 相同的基础模型,但公司表示,发布时将设置“防护措施”,以阻止模型回答许多与网络安全、生物学和化学相关的用户问题。这些请求将被重新路由到较旧的 AI 模型 Claude Opus 4.8。如果 Anthropic 猜测用户试图在 Claude Fable 5 上进行蒸馏(即从大型 AI 模型的回答中训练出较小的 AI 模型),这些请求也将被重新路由到 Claude Opus 4.8,公司表示。
在与 WIRED 的采访中,Anthropic 的产品管理负责人 Diane Penn 表示,自四月发布以来,公司一直在思考如何处理 Mythos 的软件漏洞发现能力及其他高级功能,但随后的测试和用户反馈帮助公司完善了策略。
“我们试图以一种有益的方式进行改进,即使我们目前还没有为每个使用案例提供完美的解决方案,”Penn 表示。“在所有不同的方法中,这个方法被证明是最可行和最好的。我们最终觉得,这是为用户从 Fable 5 中获得最大价值的最佳产品选择。”
目前,Penn 表示,保护机制的设计是偏向谨慎的,这意味着即使某些用户查询是无害的,也可能被路由到能力较弱的 AI 模型。随着时间的推移,Anthropic 希望提高其分类器的准确性,但 Penn 表示,目前这是公司能够广泛发布该模型的唯一安全方式。
公司周二表示,除了向 Project Glasswing 合作伙伴提供 Claude Mythos 5 外,还向“选定的生物学家”提供访问权限。此外,Anthropic 在其关于周二发布的博客文章中提到,它将向这些小客户群提供无限制版本“直到我们的受信任访问计划可用”,这暗示了未来进一步扩大访问权限的计划。自四月 Mythos 发布以来,Anthropic 一直反复强调,最终其在私营领域甚至开放权重领域的竞争对手也将不可避免地提供具有 Mythos 级别能力的模型。
Claude Mythos 和其他新型 AI 模型能够设计出可以发现并利用新旧软件中漏洞的黑客工具,这一能力迫使全球科技公司和政府在这些高级 AI 模型广泛提供给攻击者之前,提前加强软件防御。Anthropic 首次在名为 Project Glasswing 的联盟下,将 Mythos 发布给行业合作伙伴,其初衷是让成员在模型全面发布前,有先机准备自己的系统,并评估全球范围内的解决方案。
Anthropic 在上周关于 Project Glasswing 的更新中写道:“我们正在尽最大努力,安全地将 Mythos 级别的能力向公众开放。要做到这一点,我们需要高度稳健的防护措施,以防止模型的网络能力被滥用——这些防护措施,据我们所知,我们(和其他所有 AI 开发者)尚未开发出来。”
Anthropic 表示,Claude Fable 5 以文学形式命名,类似于公司现有的 Haiku、Sonnet 和 Opus 模型,它在软件工程和需要视觉理解的任务上提供了更强的性能。但这种增强的性能也伴随着代价。Claude Fable 5 和 Claude Mythos 5 的费用为每百万个输入标记 10 美元,每百万个输出标记 50 美元,是 Anthropic 公开可用 AI 模型的两倍,但比 Mythos Preview 更便宜。
Claude Fable 5 的限制性发布,暗示了 Anthropic 在商业上的矛盾:在技术行业尚未解决这些模型的网络安全问题之前,就希望将 Mythos 级别的 AI 模型发布给公众使用。4 月份,OpenAI 也秘密推出了一款具有先进网络安全能力的模型,并组建了一个类似于 Project Glasswing 的工作组。OpenAI 和 Anthropic 都已秘密提交了 IPO 申请,并在成为公开公司之前,竞相吸引潜在投资者。
尽管作为临时解决方案,Claude Fable 5 的防护措施在实际应用中能有多强,仍有待观察。Anthropic 表示,在超过 1000 小时的红队测试中,测试人员并未发现针对该模型的通用越狱方法。然而,对开发足够保护措施的担忧,是公司最初在 4 月份未向公众发布 Mythos 级别模型的原由,而这些担忧似乎仍然存在。