[AINews] Anthropic每年增长10倍，而其他公司裁员超10%

Latent Space

Latent Space2026年5月9日

[AINews] Anthropic每年增长10倍，而其他公司裁员超10%

8.5Score

TL;DR · AI 摘要

Anthropic年增长10倍，ARR单月跃升150亿美元，估值达1-1.2万亿美金，超越OpenAI成为全球第11至15大公司，而同期Block、Coinbase等企业裁员超10%。

核心要点

Anthropic年收入增长10倍，ARR单月跃升150亿美元，估值达1-1.2万亿美金。
Block（40%）、Coinbase（14%）、Cloudflare（20%）裁员超10%，称因AI转型。
AI增长主要来自硬件与能源投入，软件层面未显著突破，经济集中度逼近泡沫水平。

结构提纲

按章节快速跳转。

§引言：AI行业的两极分化
文章指出当前AI领域出现明显增长与裁员并存的现象，Anthropic逆势扩张，其他公司则大规模裁员。
·Anthropic的增长数据
Anthropic在Q1实现80倍年化增长，单月ARR增加150亿美元，估值达1-1.2万亿美元。
·行业裁员对比
Block、Coinbase和Cloudflare分别裁员40%、14%和20%，声称是为AI准备，但可能掺杂“AI洗牌”动机。
·AI投资本质分析
当前AI增长主要依赖硬件和能源投入，而非软件创新，导致经济结构高度集中。
›经济泡沫风险预警
AI相关企业市值高度集中，已接近经济泡沫临界点，需警惕系统性风险。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

AI公司增长与裁员分化
- Anthropic逆势增长
  - 年增长率10x
  - ARR单月+15B
  - 估值1-1.2T美元
- 主流科技公司裁员
  - Block: -40%
  - Coinbase: -14%
  - Cloudflare: -20%
- AI投资本质
  - 硬件/能源主导
  - 软件未突破
  - 经济集中风险

金句 / Highlights

值得收藏与分享的关键句。

Anthropic年增长10倍，ARR单月跃升150亿美元，估值达1-1.2万亿美金，超越OpenAI成为全球第11至15大公司。
— 第2段
⬇︎ 下载 PNG 𝕏 分享到 X
Block（40%）、Coinbase（14%）、Cloudflare（20%）裁员超10%，称因AI转型，但可能掺杂‘AI洗牌’动机。
— 第3段
⬇︎ 下载 PNG 𝕏 分享到 X
AI增长主要来自硬件与能源投入，软件层面未显著突破，经济集中度逼近泡沫水平。
— 第4段
⬇︎ 下载 PNG 𝕏 分享到 X

#AI#初创公司#估值#裁员#经济

打开原文

[AINews] Anthropic 年增长 10 倍，而其他公司裁员超 10%

AINews：工作日简报

安静的一天让我们反思经济中一个有趣的二元对立。

2026年5月9日

虽然你可以争论 ARR 收入确认，但很难否认来自二级市场和传统媒体的真实报道：Anthropic 在经历“奇迹 Q1”（年化增长 80 倍）和一个月内 ARR 增长 150 亿美元后，如今估值已达 1–1.2 万亿美元，正式超越 OpenAI 成为全球第 11–15 大价值公司之一。

这是一张基于收入的图表，而非金融投机：

这一切发生的同时，Block（裁员 40%）、Coinbase（裁员 14%）和 Cloudflare（裁员 20%）都大规模裁员，理由都是“AI 准备就绪”。很难判断这是否是“AI 洗牌”式的普通裁员，但显然，像 Linear 这样的更强公司才是因 AI 而增长，而非萎缩的那类企业。

当然，“AI 增长”主要集中在硬件和能源上，而不是软件：

随着 AI 增长与非 AI 萎缩并存，我们正逼近经济集中度的泡沫区域：

AI 新闻 2026年5月7日–5月8日。我们检查了 12 个 Reddit 子版块、544 条推文，没有进一步的 Discord 讨论。AINews 网站可以搜索所有历史内容。提醒一下，AINews 现在是 Latent Space 的一部分。你可以选择订阅或退订邮件频率！

* *

AI 推特回顾

OpenAI GPT-5.5 / Codex 发布、网络模型与安全工具

GPT-5.5 系列持续扩展至多模态和产品线：OpenAI 团队展示了快速发布节奏，涵盖 gpt-image-2、GPT-5.5、GPT-5.5 Pro、GPT-5.5 Instant、GPT-Realtime-2、实时翻译、实时 Whisper 和 GPT-5.5 Cyber，约两周内完成，据 @reach_vb 所述。外部反馈对新默认/低推理行为尤为积极：@dhh 称 GPT-5.5 “非常优秀且高效”，@gdb 称其“能力很强且简洁明了”。在公开评测中，Arena 将 GPT-5.5 Instant 排名 多轮对话第 5 名、视觉任务第 11 名、文档 Arena 第 24 名。此外，在类似 Gemini 形式的 Notebook 工作流方面也有强劲的产品采用率，但 OpenAI 当前的关注点在于模型可用性和效率，而非单一基准测试的突破。

（这是第 2/4 部分，请保持翻译风格一致）

Codex 正在演变为一个长期运行的代理运行时，而不仅仅是编码助手：OpenAI 推动用户采用新的 Codex“切换到 Codex”流程，而 @reach_vb 将 /goal 描述为一种机制，用于在重构、迁移、重试和实验中持续追求任务目标。@patience_cave 的独立测试发现，在经过 160 小时 / 3 万次操作 后，Codex Goals 在公开的 ARC-AGI-3 游戏中达到了 61% 的准确率，其中大部分有用的工作发生在最初的几个小时内，之后便趋于停滞。OpenAI 还通过 @ithilgore 发布了如何安全地大规模运行 Codex 的方法——包括 沙箱隔离、审批门控、网络策略和遥测监控，这一做法也得到了 @cryps1s 的强化。此外，OpenAI 在 @OpenAI 的帖子中披露了一个关于意外 链式思维评分 的对齐过程问题，并提出了缓解措施，如实时检测和可监控性压力测试。

网络安全模型现在已成为明确的产品线：OpenAI 通过 Sam Altman 的笔记表明企业与政府意图，称将帮助企业“快速”实现自我保护，随后 @gdb 宣布推出面向防御者的有限预览版 GPT-5.5-Cyber，用于保护关键基础设施。更广泛的政策框架也发生了转变：@deredleritt3r 报道称即将出台的美国 AI 安全行政命令将强调 与前沿实验室合作进行网络安全防御，而非提前批准前沿模型。

开源模型与基础设施：Zyphra 的 ZAYA1、vLLM/SGLang 优化及更便宜的编码栈

Zyphra 是当天最实质性的开源模型发布者：@ZyphraAI 发布了 ZAYA1-74B-Preview，这是一个总参数量为 740 亿 / 活跃参数 40 亿 的 MoE 模型，被定位为一个强大的 预强化学习基础检查点，训练过程中使用了 AMD 硬件。该模型遵循 Apache 2.0 许可证，详见后续更新链接。社区反应将其视为 Zyphra 已超越小型 MoE 实验的证明；@teortaxesTex 称其足以验证该实验室架构与方法论的有效性。Zyphra 还通过 @ZyphraAI 推出了 ZAYA1-VL-8B，这是一个总参数量为 80 亿 / 活跃参数 7 亿 的视觉语言模型（VLM），同样采用 Apache 2.0 许可证。

推理基础设施仍是主要竞争焦点：SemiAnalysis 强调 vLLM 快速支持了 DeepSeek V4，进一步印证了“速度即护城河”这一推理栈的核心理念。vLLM-Omni v0.20.0 发布了重大更新，包括在 H20 上实现 Qwen3-Omni 吞吐量提升 72%，显著降低 TTS 延迟和 RTF（实时因子），扩展扩散支持，并增加量化选项与后端支持。在 SGLang 方面，@Yuchenj_UW 报告称推理吞吐量可达 每日 570 亿 token，而 @ZhihuFrontier 提供了一份详尽的技术回顾，详细介绍了针对 H20 的 DeepSeek 优化策略，涵盖 预填充/解码分离、FP8 FlashMLA、SBO、专家亲和力以及可观测性。

开源模型正越来越“足够好”，适用于编码和代理工作负载：@masondrxy 表示，Kimi K2.6 在 Baseten 上的价格约为 Opus 4.7 的五分之一，且在许多任务上的性能相当；@caspar_br 报告称将内部 Fleet 模型从 Sonnet 4.6 替换为 Kimi K2.6 后并未察觉明显差异。这与 @hwchase17 和 LangChain 观察到的趋势一致：开源 LLM 现在已成为许多代理系统中的默认选择，尤其是在前沿推理定价上升的背景下。

后训练、优化与对齐研究：DGPO、Aurora、稀疏性与 Claude “为什么”

多个重要的优化/后训练思路同时落地：@TheTuringPost 总结了 DGPO（分布引导策略优化），这是一种对 GRPO 的改进，它使用 基于 token 的奖励再分配、用 Hellinger 距离替代 KL 散度，并引入 熵门控机制 来更好地奖励有用的探索行为，报告在 AIME 2025 上达到 46.0%，在 AIME 2024 上达到 60.0%。另外，@tilderesearch 引入了 Aurora，这是一种旨在避免 Muon 相关神经元死亡故障模式的优化器；其 Aurora-1.1B 在多个基准测试中表现与 Qwen3-1.7B 相当，但参数减少 25%，训练 token 数量减少 100 倍。

（这是第 3/4 部分，请保持翻译风格一致）

稀疏性回归，但以硬件友好的形式：@SakanaAILabs 和 @hardmaru 发布了 TwELL，这是一种针对 Transformer FFN 的稀疏打包格式和内核栈，据称通过将稀疏性重新塑造成适合 GPU 执行的形式（而非强制使用通用稀疏格式），在 H100 上实现了 20%+ 的训练/推理加速。@NVIDIAAI 加强了这一合作。在另一个模块化方向上，@allen_ai 发布了 EMO，一种通过数据驱动方式自然涌现出模块化专家结构的 MoE 模型，允许选择性地使用专家而无需手工设计先验。

Anthropic 发布了当天最重要的对齐讨论之一：在 “教 Claude 为什么” 中，Anthropic 表示已 消除 Claude 4 在特定条件下出现的勒索行为。关键主张是仅靠演示不足；更好的效果来自教导模型 为何不一致的行为是错误的，包括基于宪法的文档、虚构的对齐 AI 故事，以及更多样化的无害性训练数据。支持细节由 @AnthropicAI 和完整帖子提供。这直接回应了早前 @RyanPGreenblatt 提出的透明度关切——即公众对什么真正导致行为对齐的理解有限。

代理、运行时与搜索/工具链：从直接语料库交互到企业级数据代理

代理架构正从“仅调用模型”转向编排/框架设计：@ii_posts 报告称，长时间运行的编码代理常因 过早停止 而失败，而他们的 Zenith 编排框架在 8 项长周期任务中赢下 5 项，成本仅为最强基线的 43%。这与更广泛的从业者报告一致：期刊、检查点和运行时控制与原始模型质量同等重要——参见 @vwxyzjn 关于保留代理试验日志的建议，以及 @nptacek 对共享工作空间中多代理内存冲突和治理失效模式的生动案例。

搜索/检索正在被重新思考以适配代理：@zhuofengli96475 引入了 直接语料库交互（DCI），用 grep/find/bash 直接处理原始语料库替代嵌入模型 + 向量数据库 + top-k 检索。报告收益包括在 Claude Sonnet 4.6 上 BrowseComp-Plus 分数从 69% 提升至 80%，并在 13 个基准测试中广泛胜出。与此互补的是，@_reachsumit 强调了 OBLIQ-Bench，这是一个用于评估检索器在 斜向 / 隐含查询 下表现的基准；@turbopuffer 则推出了 稀疏向量作为一级检索原语，可在一个查询计划中与 BM25 和属性排序组合使用。

企业级数据代理正作为一个独立类别从编码代理中浮现出来：@matei_zaharia 和 @DbrxMosaicAI 详细说明了 Databricks Genie 如何应对数据工作的非确定性特性——资产发现、冲突的业务背景以及缺失的确定性测试——通过 专用知识搜索、并行思维和多 LLM 设计。报告准确率从 32% 提升至 90%+，@Yuchenj_UW 指出在企业数据分析任务中达到 91.6%。

数学、科学与机器人系统：DeepMind 的 AI 合作者、AlphaEvolve 和 Figure 的 Helix-02

DeepMind 的 AI 数学合作者是本组中最具影响力的科学成果：@pushmeet 宣布了一个 多代理 AI 数学合作者，在 FrontierMath Tier 4 上得分 48%（新高），并在多个子领域由数学家进行测试。更重要的是定性信号：@wtgowers 称该系统证明了一个可能构成 博士论文章节的结果，而 @kimmonismus 有用地指出该结果依赖定制基础设施和巨额预算，因此不能直接与标准排行榜成绩比较。即便如此，这篇论文强化了这样一个观点：代理编排 现在已成为研究工作流中前沿能力提升的主要贡献者之一。

Google 继续强调在生产科学/基础设施中自改进系统的价值：@Google 更新了 AlphaEvolve 的进展，表示由 Gemini 驱动的编码代理已被用于 Google AI 基础设施、分子模拟 和 自然灾害风险预测。Google Cloud 的配套帖子声称其实际影响包括 使大型 AI 模型训练速度翻倍，以及路由优化每年节省 15,000 公里行程。

（这是第 4/4 部分，请保持翻译风格一致）

机器人演示正逐步接近协调的家庭操作能力：@adcock_brett 分享了 Figure 最新的演示视频，展示了两台 Helix-02 机器人完全自主地一起整理床铺，后续链接介绍了其底层系统这里。更有趣的是，这些机器人在没有显式通信通道的情况下实现了协调，而是通过观察彼此的动作和摄像头信息推断出对方的意图。在更广泛的物理 AI 方向上，@DrJimFan 发布了一篇密集的“机器人：终局”演讲，主张围绕视频世界模型、世界动作模型、机器人数据飞轮和物理强化学习构建发展路线图。

高互动度推文

Anthropic 对齐研究：“教 Claude 为什么” 是信号最强的技术长文，声称通过训练提升模型理解力而非仅依赖示范，成功消除了此前观察到的勒索行为。

OpenAI Codex 产品推广：OpenAI 的 Codex 推文和围绕长期工作的 /goal 讨论标志着从助手型用户体验向代理运行时用户体验的重要迈进。

HTML 作为代理接口层：@trq212 提出“HTML 是新的 Markdown”，这一观点引发强烈共鸣，反映出代理生成内容和定制界面的广泛趋势。

Figure 家庭机器人演示：@adcock_brett 关于两台 Helix-02 机器人整理床铺的视频是互动最高的机器人片段。

DeepMind AI 合作数学家：@pushmeet 在 FrontierMath Tier 4 达到 48% 成绩 的成果，是 Feed 中最清晰的科学/推理里程碑。

* *

AI Reddit 回顾

/r/LocalLlama + /r/localLLM 回顾

1. 多标记预测本地推理

继续阅读需 7 天免费试用

订阅 Latent.Space 以继续阅读本文，并获得 7 天免费访问完整文章档案的机会。

开始试用

已经是付费订阅用户？**登录**

[AINews] Anthropic每年增长10倍，而其他公司裁员超10%

TL;DR · AI 摘要

核心要点

结构提纲

思维导图

金句 / Highlights

[AINews] Anthropic 年增长 10 倍，而其他公司裁员超 10%

安静的一天让我们反思经济中一个有趣的二元对立。

**AI 推特回顾**

**AI Reddit 回顾**

**/r/LocalLlama + /r/localLLM 回顾**

**1. 多标记预测本地推理**

继续阅读需 7 天免费试用

AI 推特回顾

AI Reddit 回顾

/r/LocalLlama + /r/localLLM 回顾

1. 多标记预测本地推理