Project Glasswing:初步进展更新

TL;DR · AI 摘要
Anthropic 的 Project Glasswing 已在 1 个月内联合 50+ 合作伙伴发现超 10,000 条高危漏洞,Mozilla 在 Firefox 150 中发现 271 个漏洞(是 Opus 4.6 的 10 倍以上),表明 AI 驱动的漏洞挖掘已进入规模化实战阶段。
核心要点
- Anthropic 的 Mythos Preview 模型在 1 个月内联合 50+ 合作伙伴发现超 10,000 条高危漏洞。
- Mozilla 使用 Mythos Preview 在 Firefox 150 中发现 271 个漏洞,是 Opus 4.6 的 10 倍以上。
- Cloudflare 报告 Mythos Preview 的误报率优于人工测试者,已发现 2,000 个漏洞(400 个高危)
结构提纲
按章节快速跳转。
Anthropic 启动 Project Glasswing,旨在利用 AI 提前加固关键软件系统,防止其被未来 AI 攻击。
1 个月内联合 50+ 合作伙伴发现超 10,000 条高危漏洞,部分团队漏洞发现效率提升超 10 倍。
Mozilla、Cloudflare、UK AI Security Institute、XBOW 等机构实测 Mythos Preview 表现优异,多项指标显著领先现有模型。
Anthropic 采用协调式漏洞披露(CVD)政策,暂不公开细节以防攻击滥用,待补丁广泛部署后将公布深入分析。
AI 驱动的漏洞挖掘已从‘发现能力受限’转向‘修复与响应能力受限’,推动安全防御进入自动化快车道。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Project Glasswing:AI 驱动的漏洞挖掘进展
- 核心成果
- 10,000+ 高危漏洞(1 个月)
- 效率提升 >10x
- 关键验证案例
- Mozilla:271 漏洞(FF 150)
- Cloudflare:2,000 漏洞,误报率 < 人工
- UK AI Security Institute:首个双 range 全解模型
- 策略与影响
- 协调式披露(CVD)
- 防御范式转变:响应 > 发现
金句 / Highlights
值得收藏与分享的关键句。
Mozilla 使用 Mythos Preview 在 Firefox 150 中发现 271 个漏洞,是 Opus 4.6 的 10 倍以上。
Cloudflare 报告 Mythos Preview 的误报率优于人工测试者,已发现 2,000 个漏洞(400 个高危)。
UK AI Security Institute 报告 Mythos Preview 是首个完整解决其两个网络攻防模拟(cyber ranges)的模型。
标题:Project Glasswing:初步进展更新
来源链接:https://www.anthropic.com/research/glasswing-initial-update
Markdown 内容:
上个月,我们启动了 Project Glasswing——一项旨在保护全球最关键软件的协作计划,以防止日益强大的人工智能模型被用于攻击这些系统。
自启动以来,我们与约 50 家合作伙伴共同使用 Claude Mythos Preview,在全球最具系统重要性的软件中发现了逾一万条高危或严重级别的漏洞。过去,软件安全领域的进展受限于我们发现新漏洞的速度;如今,瓶颈已转变为:我们能多快地验证、披露并修复由人工智能发现的大量漏洞。
本文将探讨我们在 Project Glasswing 初期几周内,对网络安全领域这一关键挑战所获得的见解。我们重点关注 Mythos Preview 的早期公开性能表现、我们对数千个开源软件项目进行扫描的初步成果,以及这些进展对当前网络防御者的意义。此外,我们还将介绍 Project Glasswing 的后续计划,以及我们对未来发布 Mythos 系列模型的思考。
我们的初步成果
关于 Mythos Preview 发现结果的讨论方式
软件行业长期以来遵循的惯例是:在漏洞被发现后的 90 天(或若补丁在 90 天内发布,则在补丁可用后约 45 天)内公开披露新漏洞。此举旨在为最终用户留出时间更新其软件,从而避免漏洞被攻击者利用。我们自己的 协同漏洞披露政策 也采用了这一做法。
然而,这也意味着已披露的漏洞只是人工智能模型网络能力前沿加速发展的滞后指标:目前我们尚无法在不危及最终用户安全的前提下,全面详述合作伙伴通过 Mythos Preview 所发现的漏洞细节。因此,我们仅提供该模型性能的代表性示例,并汇总截至当前的整体进展数据。一旦 Mythos Preview 所发现漏洞的补丁得到广泛部署,我们将进一步详细分享我们的发现与经验。
合作伙伴与外部测试者的实证反馈
Project Glasswing 的首批合作伙伴,均为构建并维护互联网及其他关键基础设施核心软件的机构。修复其代码中的缺陷,不仅可降低依赖这些软件的众多组织所面临的风险,更可惠及数十亿最终用户。
一个月以来,多数合作伙伴各自在其软件中发现了数百个严重或高危漏洞;累计发现总数已超过一万条。多家合作伙伴反馈,其漏洞发现速率提升了十倍以上。例如,Cloudflare 在其关键路径系统中发现了 2,000 个漏洞(其中 400 个为高危或严重级别),且其团队认为该模型的误报率优于人类测试员。
这一结论也与外部测试者对 Mythos Preview 性能的体验,以及近期对该模型的额外评估结果一致:
- 英国人工智能安全研究所(AI Security Institute)报告称,Mythos Preview 是首个在其网络攻防模拟环境(多步骤网络攻击仿真)中端到端完成全部任务的模型;
- Mozilla 在测试 Mythos Preview 期间,于 Firefox 150 中发现并修复了 271 个漏洞,数量是其在 Firefox 148 中使用 Claude Opus 4.6 所发现数量的十倍以上;
- 独立安全平台 XBOW 报告称,Mythos Preview 在其 Web 渗透测试基准中“显著超越所有现有模型”,且在逐令牌(token-for-token)基础上实现了“前所未有的精准度”;
- 最近发布的两个学术基准测试——**ExploitBench** 与 **ExploitGym**(用于评估模型的漏洞利用开发能力)——均显示 Mythos Preview 为当前最强模型。我们在 Frontier Red Team 博客 中对此类基准测试结果及其对模型能力的启示进行了更深入探讨。
更广泛而言,我们正观察到补丁部署速度显著加快:帕洛阿尔托网络公司(Palo Alto Networks)最新发布的版本中,补丁数量较以往高出 五倍以上;微软表示,其后续发布的补丁数量“将在一段时间内持续保持高位”;甲骨文(Oracle)在其产品与云服务中发现并修复漏洞的速度也已提升至此前的数倍。
此外,Mythos Preview 在其他类型的安全工作中也展现出实用价值。例如,在我们的一家 Glasswing 合作伙伴银行,该模型曾协助识别并阻止了一起欺诈性 150 万美元电汇事件——攻击者在入侵客户邮箱后,通过伪装电话实施诈骗。
开源软件
过去几个月中,Anthropic 使用 Mythos Preview 对超过 1,000 个开源项目进行了扫描。这些项目 collectively( collectively 在此意为“ collectively” → “共同地”或“总计”)构成了互联网的大部分基础,也支撑着我们自身的基础设施。
截至目前,Mythos Preview 已在这些项目中识别出约 6,202 个高危或严重级别漏洞(总计扫描了 23,019 个漏洞,其中还包括其评估为中危或低危的漏洞)。
在上述高危或严重级别漏洞中,已有 1,752 个由六家独立安全研究机构之一(少数情况下由我们自行)进行了细致评估。其中,90.6%(1,587 个)被确认为真实存在的漏洞(即真阳性),62.4%(1,094 个)被最终确认为高危或严重级别。这意味着,即使 Mythos Preview 不再发现新的漏洞,仅依据当前经过人工复核后的真阳性率,它已有望在开源代码中发现近 3,900 个高危或严重级别的漏洞——这还不包括其为 Project Glasswing 合作伙伴所发现的漏洞。需要明确的是,我们计划持续对开源代码进行扫描,因此该数字预计还将继续上升。
一个 Mythos Preview 检测到的开源漏洞实例是 wolfSSL——一款以安全性著称的开源密码学库,被全球数十亿设备所采用。Mythos Preview 构建了一套可利用该漏洞的攻击工具,攻击者借此可伪造数字证书(例如,用于搭建银行或邮件服务商的仿冒网站)。此类网站对终端用户而言看起来完全合法,实则完全由攻击者掌控。我们将在未来几周内发布关于该漏洞(已修复,编号为 CVE-2026-5194)的完整技术分析报告。
如前所述,当前修复此类漏洞的瓶颈在于:人工资源在漏洞评估、报告撰写,以及补丁设计与部署方面的能力有限。而 Mythos Preview 的出现,使得漏洞的发现过程变得前所未有的高效。下方我们提供了一个开源漏洞仪表盘,展示了漏洞披露流程的各个阶段,并将持续追踪我们的进展。该仪表盘涵盖所有严重级别的漏洞(而不仅限于 Mythos Preview 初步评估为高危或严重级别的子集)。注意各阶段数量的急剧下降,反映出验证与修复每个漏洞所需投入的人力工作量。

我们的开源漏洞仪表盘,展示所有严重级别的漏洞(而非仅 Mythos Preview 初步评估为高危或严重级别的漏洞)。
我们对漏洞的评估流程十分严谨:首先,我们或合作的外部安全机构会复现 Mythos Preview 发现的问题,并重新评估其严重性;一旦确认漏洞真实存在,我们还会检查是否已有现成修复方案,并向软件维护者提交一份详尽的报告。我们在此过程中格外谨慎:除了一般开源软件维护所面临的常规挑战外,维护者们目前还饱受大量低质量、由 AI 生成的漏洞报告困扰。事实上,多位维护者向我们反馈,他们当前人力严重不足,甚至有部分请求我们适当降低漏洞披露频率,以便他们有更充足时间设计补丁。(平均而言,Mythos Preview 发现的一个高危或严重级别漏洞,修复耗时约为两周。)
应维护者要求,我们有时会跳过进一步评估,直接披露漏洞。截至目前,我们已直接披露了 1,129 个未经验证的漏洞,其中 Mythos Preview 估计有 175 个为高危或严重级别。
我们估计,截至目前已向维护者披露了 530 个高危或严重级别的漏洞。该数字基于以下评估方式:对于直接披露的漏洞,由 Claude 进行严重性评估;对于其他情况,则依据维护者或我方安全合作伙伴的评估结果。另有 827 个已确认漏洞(评估方式同上,亦为高危或严重级别),我们正力求尽快完成披露。
在已披露的 530 个高危或严重级别漏洞中,已有 75 个被修复,其中 65 个已发布公开安全通告。目前补丁数量仍相对较少,原因有三:第一,我们尚处于《协调漏洞披露政策》所设定的 90 天窗口期的早期阶段,预计近期将有更多补丁上线;第二,我们可能低估了实际补丁数量,因为部分漏洞在修复时并未发布公开通告——此时我们需依赖 Claude 自行扫描以确认补丁是否已部署;第三,补丁数量偏低也反映出一个真实问题:即便我们披露节奏相对缓慢,Mythos Preview 的发现仍加剧了本已超负荷的安全生态系统的压力。
相较于漏洞发现的相对便捷性,修复过程的复杂性构成了网络安全领域的一项重大挑战。若能成功应对这一挑战,将使我们的软件系统比以往更加安全。下文将探讨防御者可采取的一些适应性策略。
迎接网络安全的新阶段
具备与 Mythos Preview 相当的网络安全能力的模型,即将更广泛地面向公众开放。软件行业亟需开展更大规模的协同努力,以应对这些模型所生成的海量发现成果。
目前,从漏洞被发现、到开发出修复补丁、再到该补丁被终端用户广泛部署之间,往往存在较长的时间滞后。这为攻击者利用关键软件漏洞提供了显著的窗口期。Mythos 类模型大幅缩短了发现和利用漏洞所需的时间与成本,从而放大了此类时间滞后所带来的风险。最终,Mythos 类模型将帮助开发者构建更安全的软件——在漏洞上线前就将其发现并修复。但在此过渡阶段——即漏洞正被快速发现,而补丁却仍缓慢部署的时期——将带来新的安全风险。
软件开发者与用户应立即采取行动,以降低自身暴露于这些风险之中的可能性。以下建议并非全新内容,许多研究人员(包括 Anthropic 内部团队)当前正致力于开发更优、更持久的解决方案。在此期间,确保基础工作扎实尤为关键:
- 软件开发者应缩短补丁发布周期,尽快提供安全修复。合理利用公开可用的 AI 模型可在此过程中提供帮助;我们正在构建工具并分享研究成果以支持这一目标(更多细节见下文)。开发者还应尽可能简化更新流程,帮助用户及时升级软件;在可行范围内,对仍在运行存在已知漏洞软件的用户,应更积极地推动其完成修复。
- 网络防御者应缩短补丁测试与部署周期。由 美国国家标准与技术研究院 和英国 国家网络安全中心 等机构提出的关键控制措施,如今愈发重要——因为它们能在不依赖单个补丁及时部署的前提下提升整体安全性。这些措施包括:加固网络默认配置、强制启用多因素认证(MFA),以及保留详尽的日志记录,以支持检测与响应工作。
利用公开可用的 AI 模型增强网络防御能力
当前许多通用模型已能发现大量软件漏洞,尽管它们尚无法像 Claude Mythos Preview那样精准发现最复杂的漏洞或高效实现漏洞利用。Project Glasswing 已促使多家机构主动使用这些通用模型对其自有代码库开展安全审查;我们正致力于进一步简化这一流程。
首先,我们已面向 Claude Enterprise 客户开放 Claude Security 的公开测试版。该工具可协助团队扫描代码库中的漏洞,并生成修复建议。自上线三周以来,Claude Opus 4.7 已协助修复超过 2,100 个漏洞。(其效率高于前述开源修复方式,主要原因在于企业可直接修复自身代码,而开源修复通常依赖志愿者维护者,需通过协调披露流程逐步推进。)
我们还启动了 网络验证计划,允许以合法网络安全目的(如漏洞研究、渗透测试与红队演练)使用我们模型的安全专业人员,在无需受限于部分旨在防止网络滥用的安全防护机制的前提下开展工作。
此外,我们正应符合条件客户的安全团队请求,开放此前我们及合作伙伴在 Mythos Preview 中使用的工具。目标是让高能力公共模型的性能发挥更简单高效,避免繁琐的前期配置。本次发布包含:
- 我们与合作伙伴共同构建并共享的 技能(即用于重复性工作的自定义指令);
- 一套辅助框架,帮助 Claude 自动映射代码库、启动扫描子代理、分类其发现结果并撰写报告;
- 一个威胁建模构建器,可对代码库进行分析,识别潜在攻击目标,并据此优先安排模型的工作重点。
我们的 Project Glasswing 合作伙伴思科(Cisco)近期也开源了其 Foundry Security Spec,旨在帮助其他防御者构建与自身所用类似的评估体系。
支持生态建设
我们已与开源安全基金会(Open Source Security Foundation)旗下的 Alpha-Omega 项目达成 合作,以支持该基金会协助开源项目维护者处理与分类漏洞报告。我们亦持续发布研究成果,探索前沿模型能力如何更有效地赋能网络防御者。
我们还支持开发了 ExploitBench 和 ExploitGym 两项新基准测试,使研究人员能够长期追踪前沿 AI 模型在漏洞利用开发方面的能力演进(详见此处)。我们亦通过 外部研究员访问计划 支持其他高质量量化基准的开发。最后,Claude for Open Source 项目致力于服务开源维护者与贡献者;未来,我们承诺对自身所采用的任何开源软件包进行扫描。
Project Glasswing 的下一步计划
AI 技术发展的速度意味着,像 Mythos Preview 这样能力强大的模型,很快将被众多不同的 AI 公司研发出来。目前,尚无任何公司——包括 Anthropic——已开发出足够强大的安全防护机制,以防止此类模型被滥用并可能造成严重危害。这正是我们尚未向公众发布 Mythos 级别模型的原因。但同样,这也促使我们启动了“玻璃之翼”(Project Glasswing)项目:一旦某家机构发布了具备同等能力却缺乏此类安全防护的模型,全球几乎任何人都将迅速以极低的成本和极高的便捷性,利用其中存在的软件漏洞进行攻击。
“玻璃之翼”项目旨在为最关键的网络防御者提供一种非对称优势。然而,当前亟需尽可能多的组织加强其网络安全防护能力。我们希望,通过向公众开放的模型,以及配套提供的新工具、资源与研究成果,能够助力这些组织提升其整体网络安全水平。
接下来,我们将与关键合作伙伴(包括美国及盟国政府)协作,进一步扩大“玻璃之翼”项目的合作范围。同时,在不久的将来,一旦我们研发出所需的强大得多的安全防护机制,我们期待通过公开发布的方式,向全社会提供 Mythos 级别的模型。
跨越这些风险之后,我们将迎来一个令人鼓舞的未来:关键代码的防护水平将远超今日,网络攻击也将大幅减少。尽管前路障碍重重,但我们依然坚信,“玻璃之翼”项目将有助于我们抵达这一目标。
相关内容
2028 年:全球 AI 领导地位的两种可能情景
我们对中美之间 AI 竞争的见解。 了解更多
教会 Claude “为什么”
关于我们在减少代理式对齐偏差方面的新研究。 了解更多
自然语言自编码器:将 Claude 的思维转化为文字
像 Claude 这样的 AI 模型用语言交流,但其内部思考以数字形式进行。本项研究中,我们训练 Claude 将其内部思维翻译为人类可读的文本。 了解更多