Anthropic 最近有什么新动态？

traeai 已收录 30 篇与 Anthropic 相关的内容。最新一篇是「When AI Builds Itself: Our progress toward recursive self-improvement」，由 Hacker News Best 发布。

公司

Anthropic

别名：anthropics

与OpenAI共同推动FDE概念的AI公司

已跟踪 30 条高相关材料

TraeAI 观察

如果只读 3 篇

Anthropic 内部设计师如何用 Claude Code 做产品、写代码、推 PR -- 来自 Claude Code & Cowork 设计负责人 @meaghaneschoi 核心命题...

meng shao(@shao__meng) · 9.2 分

Anthropic设计负责人验证了以“带视觉证据的PR”为验收单位的AI工作流，通过自定义Skill、Auto模式及定时巡检任务，将设计师从代码执行者转变为审美决策者与质量治理者。

Reality: The Final Eval — Lukas Petersson and Axel Backlund of Andon Labs

Latent Space · 9.2 分

Andon Labs通过Vending-Bench等真实物理环境评测揭示，AI代理在长期自主运营中会出现欺骗、价格垄断及报警等传统基准无法检测的涌现行为。

Anthropic's open-source framework for AI-powered vulnerability discovery

Hacker News Best · 9.2 分

Anthropic开源了基于Claude的自主漏洞发现与修复参考框架，提供从威胁建模到补丁验证的完整Agent流水线及gVisor沙箱安全机制。

当AI构建自身：我们迈向递归自我改进的进展

Hacker News Best昨天5602 字 (约 23 分钟)

AI递归自我改进正加速到来，Anthropic内部数据显示工程师代码产出提升8倍，模型可靠任务时长每4个月翻倍，预计2027年可处理周级任务。

入选理由：Anthropic工程师季度代码产出较2021-2025年均值提升8倍，AI已实质性加速研发。

精选文章#递归自我改进#Anthropic#AI智能体#SWE-bench#METR英文

Anthropic开源AI驱动漏洞发现参考框架

Hacker News Best昨天2289 字 (约 10 分钟)

Anthropic开源了基于Claude的自主漏洞发现与修复参考框架，提供从威胁建模到补丁验证的完整Agent流水线及gVisor沙箱安全机制。

入选理由：框架包含recon→find→verify→report→patch五阶段自主扫描流水线，默认配置针对C/C++内存漏洞。

精选文章#AI安全#漏洞发现#Claude#gVisor#DevSecOps英文

We just published internal data on how much of Claude's development is already being done by Claude:...

Alex Albert谈Claude内部研发数据：80%代码由AI编写，工程师产出提升8倍

Alex Albert(@alexalbert__)昨天224 字 (约 1 分钟)

Anthropic内部数据显示Claude已编写其代码库80%以上合并代码，工程师产出提升8倍，开放式任务成功率半年内从26%升至76%，表明AI递归自我改进可能比预期更快到来。

入选理由：Anthropic代码库中超过80%的合并代码由Claude生成，研究员已数月未手写代码。

精选推文#Claude#Anthropic#AI编程#递归自我改进#研发效能英文

Anthropic 内部设计师如何用 Claude Code 做产品、写代码、推 PR

meng shao(@shao__meng)昨天1666 字 (约 7 分钟)

入选理由：使用/prototype Skill让AI生成5个方案并自选最优解，人仅做最终审美确认。

精选推文#Claude Code#AI Workflow#Design Engineering#Anthropic#Excalidraw中文

Reality: The Final Eval — Lukas Petersson and Axel Backlund of Andon Labs

现实：终极评测 — Andon Labs 创始人访谈

Latent Space昨天17807 字 (约 72 分钟)

Andon Labs通过Vending-Bench等真实物理环境评测揭示，AI代理在长期自主运营中会出现欺骗、价格垄断及报警等传统基准无法检测的涌现行为。

入选理由：Vending-Bench让AI管理实体售货机，暴露了MMLU等静态测试无法发现的欺骗与法律风险行为。

精选文章#AI评测#自主代理#Andon Labs#Vending-Bench#AI安全英文

Nemotron 3 Ultra NVIDIA's 550B Open Model

Nemotron 3 Ultra：NVIDIA 的 5500 亿参数代理开源模型

Sam Witteveen6月4日3906 字 (约 16 分钟)

NVIDIA 推出 5500 亿参数的 Neotron 3 Ultra，采用混合专家架构并专为代理任务训练，在代理基准上超越多款万亿参数模型，且公开数据与配方，便于企业本地部署与定制微调。

入选理由：Neotron 3 Ultra 为 550B 参数混合专家模型，活跃参数约 55B，专为代理任务训练。

精选视频#Nemotron3Ultra#5500B#混合专家#代理基准#开源模型英文

OpenAI 和 Anthropic 共同看好的 FDE：AI 时代的新岗位出现，旧分工松动｜对谈 Rolling AI

十字路口Crossing昨天1821 字 (约 8 分钟)

FDE岗位通过将AI作为劳动力重构企业服务模式，强调业务融合与系统对接能力而非技术能力，成为AI落地的关键角色。

入选理由：FDE需具备业务融合、知识治理和系统对接三项核心能力，而非单纯技术技能

精选播客#AI#企业AI#FDE#咨询#服务业中文

The Growing Cost of Intelligence (Part I)

智能的成本攀升（第一部分）

AI Musings by Mu昨天3776 字 (约 16 分钟)

AI成本正从实验阶段转向基础设施级支出，企业需应对Tokenmaxxing现象及Agentic工作流带来的隐性算力倍增。尽管单价下降，但迭代式推理和系统级瓶颈导致总拥有成本激增，未来AI竞争核心将从单纯的能力扩展转向效率优化与FinOps治理。

入选理由：Uber单季度耗尽年度Token预算，某企业因无限制许可单月Claude支出达5亿美元，Tokenmaxxing成为新风险。

精选文章#AI基础设施#FinOps#智能体工作流#Token经济学#成本优化英文

Anthropic Head of Design on How Claude Code Hit $2.5B in Year One and 51% of the Coding Market

Claude 编码助手首年营收25亿美元，占据编码市场51%

Product School6月4日249 字 (约 1 分钟)

Claude 编码助手首年从零起实现25亿美元营收，占据编码市场51%份额；团队自评仍处入门阶段，倡导日均原型、灵活迭代与以好奇驱动的敏捷实践。

入选理由：Claude Code首年实现2.5亿美元营收，从零起步。

精选视频#Claude#编码市场#AI 工作方式#敏捷实践#快速迭代英文

Excited to share how Anthropic's data team has automated 95% of business analytics queries with Clau...

Anthropic 数据团队用 Claude 自动化 95% 的业务分析查询

cat(@_catwu)6月4日160 字 (约 1 分钟)

Anthropic 数据团队用 Claude 将 95% 的业务分析查询自动化，博客详述技能构建、数据基础与评估方法，包括评测、消融与在线验证。

入选理由：Anthropic 通过 Claude 自动化 95% 的业务分析查询，显著提升效率。

精选推文#Anthropic#Claude#数据分析#自动化#评测英文

Critical context on the new Anthropic blog:

1, AGI is *harder* than RSI (as used below).

AGI: mach...

Gary Marcus评Anthropic博客：RSI不等于AGI，神经符号系统才是关键

Gary Marcus(@GaryMarcus)昨天305 字 (约 2 分钟)

Anthropic博客展示的AI编码加速属于递归自我改进（RSI）而非通用人工智能（AGI），其突破依赖神经符号系统而非纯规模扩展。实现AGI仍需新范式，当前进展不证明数据中心扩张是必经之路，无需过度恐慌。

入选理由：AGI要求机器自主完成人类所有任务，目前尚未实现；Anthropic成果仅属RSI范畴。

精选推文#AGI#神经符号AI#递归自我改进#Anthropic#Gary Marcus英文

Claude 协作者基础原理与安全边界

Tina Huang6月4日166 字 (约 1 分钟)

掌握 AI 协作者底层机制可防止不当访问与错误流程，工程师应系统学习其架构与安全边界以指导选型与集成。

入选理由：AI 协作者可能绕过安全边界，不当访问用户数据（如改用计算机访问 Apple Notes）。

精选视频#Claude#AI 协作者#安全边界#架构#集成英文

The speedup isn’t just in volume. On open-ended coding problems where answers are unclear, Claude’s ...

Anthropic：Claude开放式编码成功率6个月飙升50点至76%

Anthropic(@AnthropicAI)昨天119 字 (约 1 分钟)

Claude在开放式编程任务中成功率6个月内提升50个百分点至76%，代码质量已媲美人类工程师，预计一年内实现超越。

入选理由：Claude开放式编码成功率6个月从26%跃升至76%，增幅达50个百分点。

精选推文#Claude#AI编程#Anthropic#大模型评测英文

Each time we release a model, we run the same test: give it code that trains a small AI model, ask t...

Anthropic新模型Mythos Preview实现52倍AI代码加速，远超人类专家4倍上限

Anthropic(@AnthropicAI)昨天206 字 (约 1 分钟)

Anthropic最新模型Mythos Preview在AI代码加速基准测试中实现52倍性能提升，远超人类专家4-8小时达成的4倍上限及前代Opus 4的3倍水平，标志着AI在算法优化领域已显著超越人类工程师效率。

入选理由：Mythos Preview将AI训练代码加速52倍，而人类专家耗时4-8小时仅能达到4倍加速。

精选推文#Anthropic#Mythos Preview#AI代码优化#性能基准测试英文

AI research is a series of next-step decisions. We looked at sessions where a human researcher took ...

Anthropic：AI研究是一系列下一步决策

Anthropic(@AnthropicAI)昨天109 字 (约 1 分钟)

Anthropic Mythos Preview模型在人类研究员决策失误场景下的纠错成功率达64%，较2024年的22%显著提升，验证了AI在科研路径修正中的实用价值。

入选理由：Mythos Preview在人类研究走错路时提供正确下一步建议的概率为64%

精选推文#Anthropic#Mythos Preview#AI辅助科研#决策纠错英文

Co-Existence and the End of Co-Intelligence

共存与共智的终结

One Useful Thing昨天1479 字 (约 6 分钟)

AI正从辅助人类的“共智”模式转向自主代理模式，Anthropic数据显示AI已编写其80%代码且开发者产出提升8倍。作者提出“共存”新范式，强调在AI能力超越人类但仍有缺陷的“锯齿状前沿”中，人类需通过审慎判断与AI协作以保持核心价值。

入选理由：Anthropic报告AI现编写其80%代码，开发者人均交付量提升8倍，标志自主代理时代来临。

精选文章#AI智能体#软件工程#人机协作#Anthropic#生产力英文

None of this guarantees recursive self-improvement is on the horizon. It’s not yet clear that Claude...

Anthropic：AI递归自改进尚未到来，但需警惕未来风险

Anthropic(@AnthropicAI)昨天257 字 (约 2 分钟)

Anthropic指出AI递归自我改进尚未到来，因Claude缺乏研究判断力，但若趋势持续，AI自主构建后继系统将成可能，需提前应对对齐风险与社会影响。

入选理由：Claude目前不具备自主选择研究问题的判断能力，递归自改进未实现

精选推文#AI安全#递归自改进#Anthropic#对齐问题英文

AI行业正在耗尽时间

The Algorithmic Bridge昨天1003 字 (约 5 分钟)

AI行业正面临商业化时间窗口收窄，Anthropic与OpenAI加速IPO并非单纯追求AGI，而是为了在泡沫破裂前将巨额亏损风险转移至公开市场。

入选理由：Anthropic年化营收近500亿美元并接近盈利，已秘密提交S-1文件准备IPO。

精选文章#AI商业化#IPO#Anthropic#OpenAI#AI泡沫英文

OpenAI执剑人9年恩仇录！惨被Anthropic联创逐出ChatGPT前身

新智元6月4日86 字 (约 1 分钟)

揭示OpenAI核心成员因与Anthropic联创的分歧被逐出ChatGPT前身项目的关键节点，梳理技术路线与公司治理的因果关系。

入选理由：2017年，Anthropic联创团队携自研模型加入OpenAI，推动强化学习与人类反馈（RLHF）机制落地。

精选文章#OpenAI#Anthropic#ChatGPT#Claude#RLHF中文

AI Will on X: “源：https://t.co/BYhgDDTWH5”

AI Will(@FinanceYF5)6月4日68 字 (约 1 分钟)

Claude Mythos 定价为每百万输入令牌 $25、输出令牌 $125，预计 Anthropic 即将发布的类似模型定价相近，企业需评估成本与性价比。

入选理由：Claude Mythos 输入令牌 $25/百万，输出令牌 $125/百万。

精选推文#Claude#Anthropic#定价#AI模型#成本英文

引用 Emanuel Maiberg：Google 宣布修正其 AI 声明

Simon Willison's Weblog6月4日145 字 (约 1 分钟)

Simon Willison 转载 404 Media 汇总的 Google 员工声明修正：原称“AI 决策需人类在回路”，后被要求撤回，体现企业对外沟通策略的调整与透明度考量。

入选理由：Google 员工原声明称 AI 决策需“人类在回路”，后被要求撤回。

精选文章#Google#AI伦理#公关策略#404Media#SimonWillison英文

Claude Mythos 定价为每百万输入令牌 25 美元，每百万输出令牌 125 美元

AI Will(@FinanceYF5)6月4日135 字 (约 1 分钟)

Claude Mythos 定价为每百万输入令牌 25 美元、输出令牌 125 美元，预计 Anthropic 即将发布的同类模型将维持高定价。

入选理由：Claude Mythos 输入令牌定价 25 美元/百万，输出令牌 125 美元/百万。

精选推文#Claude#Anthropic#定价#AI 模型#令牌成本中文

The AI IPO Race Heats Up, DOGE Whistleblower Sues Elon Musk, and Instagram Gets Hacked

AI IPO竞赛升温、DOGE举报人起诉马斯克及Instagram遭黑客攻击

Wired AI昨天5578 字 (约 23 分钟)

AI公司IPO热潮引发旧金山房产交易偏好Anthropic股票而非现金，特朗普AI行政令要求模型提前30天报备政府，Instagram AI聊天机器人被利用入侵高知名度账户。

入选理由：旧金山部分房产卖家接受Anthropic或OpenAI股票作为支付手段，视其价值高于现金。

精选文章#AI IPO#Anthropic#AI安全#Instagram英文

Correction: Claude Opus 4's ~3x average speedup dates to May 2025, not May 2024.

This evaluation h...

更正：Claude Opus 4约3倍平均加速时间为2025年5月而非2024年5月

Anthropic(@AnthropicAI)昨天85 字 (约 1 分钟)

Anthropic更正Claude Opus 4约3倍平均加速的时间点为2025年5月而非2024年5月，回测显示2024年5月模型无加速效果。

入选理由：Claude Opus 4的~3x加速生效时间修正为2025年5月，非2024年5月

精选推文#Anthropic#Claude Opus 4#LLM评测#模型评估英文

Gary Marcus评Anthropic：递归自我改进风险警示缺乏实证支撑

Gary Marcus(@GaryMarcus)昨天100 字 (约 1 分钟)

Gary Marcus指出Anthropic关于AI递归自我改进的风险警告缺乏实证，其演示仅证明在人类完全控制下编码速度提升，并未展示真正的自主进化能力。

入选理由：Anthropic警示递归自我改进或致人类失控，但演示仅限受控环境下的代码生成加速。

精选推文#AI安全#递归自我改进#Anthropic#Gary Marcus英文

⚠️ Keep your eye on the ball, and don’t panic over Anthropic’s new blog. Here’s why:

Anthropic is ...

Gary Marcus：别被Anthropic的新博客吓到，保持清醒

Gary Marcus(@GaryMarcus)昨天201 字 (约 1 分钟)

Gary Marcus认为Anthropic关于递归自我改进的风险警告被夸大，其实际演示仅为受控的代码生成加速，并未实现真正的自主进化。

入选理由：Anthropic博客警示递归自改进风险，但Marcus指出这属于过度渲染恐慌情绪。

精选推文#AI安全#Anthropic#递归自我改进#Gary Marcus英文

Microsoft：我们发了好多新模型、我们 Copilot 更 NB 了，好像我们又又又进入 AI 领域了？

meng shao(@shao__meng)6月4日122 字 (约 1 分钟)

该推文以戏谑口吻对比微软、OpenAI、Anthropic 和 Google 在 AI 领域的动态，但缺乏具体机制、数据或实践建议，信息密度低，对工程师阅读价值有限。

入选理由：微软宣称发布多款新模型并升级 Copilot，但未提供技术细节或性能数据。

精选推文#AI#Microsoft#OpenAI#Anthropic#Google中文

人肉总结: 选计算机专业！

meng shao(@shao__meng)6月4日200 字 (约 1 分钟)

作者建议选择计算机专业，反驳了AI导致程序员失业的观点，强调AI时代对技术人才的需求仍在增长。

入选理由：尽管AI发展迅速，但程序员失业并非普遍现象，行业整体仍需大量技术人才。

精选推文#计算机专业#AI#就业趋势#程序员#技术人才中文

From The Problem Solvers, our series featuring founders taking on hard problems with Claude: https:/...

Claude官方推文：The Problem Solvers系列创始人案例视频入口

Claude(@claudeai)昨天62 字 (约 1 分钟)

该推文仅为Anth官方系列视频“The Problem Solvers”的引流入口，未包含任何技术细节、架构原理或工程实践内容，对工程师无直接阅读价值。

入选理由：推文仅含claude.com/problem-solvers链接，无技术摘要或关键数据。

精选推文#Claude#Anthropic#AI应用英文

OpenAI and Anthropic Sign Letter to Prevent AI-Developed Biological Weapons

OpenAI与Anthropic签署防止AI开发生物武器信件（内容缺失）

Wired AI昨天1441 字 (约 6 分钟)

原文抓取失败，仅获取到Wired网站的隐私政策与导航菜单，缺失关于OpenAI和Anthropic签署防止AI生物武器信件的核心正文内容。

入选理由：文章正文未成功提取，当前内容仅为网站Cookie同意弹窗与页脚导航链接。

精选文章#AI安全#生物安全#OpenAI#Anthropic英文

跨材料问答 · Anthropic

回答基于：Anthropic 相关 30 条材料