T
traeai
登录
返回首页
Simon Willison's Weblog

Initial impressions of Claude Fable 5

8.5Score
Initial impressions of Claude Fable 5

TL;DR · AI 摘要

Claude Fable 5 是一个功能强大但价格高昂的模型,具有严格的防护机制,适用于需要高安全性的场景。

核心要点

  • Claude Fable 5 的价格是 Claude Opus 4.5/4.6/4.7/4.8 的两倍,输入 $10/million,输出 $50/million。
  • Fable 5 拥有 100 万 token 的上下文窗口和 128,000 的最大输出 token。
  • Fable 5 与 Mythos 5 的主要区别在于 Fable 5 有更严格的防护机制,防止被用于有害目的。

结构提纲

按章节快速跳转。

  1. 作者在没有早期访问权限的情况下,对 Claude Fable 5 进行了全面测试。

  2. Claude Fable 5 提供与 Mythos 5 相同的性能,但具有更严格的防护机制。

  3. Fable 5 的价格是 Opus 4.5/4.6/4.7/4.8 的两倍,但具有更大的上下文窗口和输出 token。

  4. Fable 5 在知识广度和准确性上表现更优,但价格更高。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • Claude Fable 5
    • 关键特性
      • 严格的安全防护机制
      • 与 Mythos 5 相同的性能
      • 100 万 token 上下文窗口
    • 价格与性能
      • 价格是 Opus 4.5/4.6/4.7/4.8 的两倍
      • 128,000 最大输出 token

金句 / Highlights

值得收藏与分享的关键句。

  • Claude Fable 5 的价格是 Claude Opus 4.5/4.6/4.7/4.8 的两倍,输入 $10/million,输出 $50/million。

    第 3 段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • Fable 5 与 Mythos 5 的主要区别在于 Fable 5 有更严格的防护机制,防止被用于有害目的。

    第 3 段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • Fable 5 在知识广度和准确性上表现更优,但价格更高。

    第 4 段

    ⬇︎ 下载 PNG𝕏 分享到 X
#Claude#AI模型#Anthropic#机器学习
打开原文

对 Claude Fable 5 的初步印象

Simon Willison 的博客

订阅

#smallhead

由以下公司赞助:

AWS — 如果你正在使用 AI 进行开发,6 月 17 日在纽约市举行的 AWS Summit 是你必须参加的活动。200 多场会议,完全免费。

[立即注册]

对 Claude Fable 5 的初步印象

2026 年 6 月 9 日

我今天没有提前访问 Claude Fable 5 的发布版本,但过去大约 5.5 小时我一直在对其进行测试。我的初步印象是,这是一款相当强大的模型。它运行速度较慢,价格昂贵,但迄今为止,它处理我抛给它的所有任务都表现得非常稳定。与当前前沿模型常见的状况一样,挑战在于找到它无法完成的任务。

首先,让我们回顾一下其主要特性。

Anthropic 声称,Claude Fable 5 在性能方面与 Claude Mythos 5 相同,但增加了更严格的防护机制,以防止其被用于有害用途。这些防护机制触发频率较高,因此 Claude API 新增了一些机制,用于在触发时通知你,甚至新增了一个选项,当某些内容被拒绝时,可以自动切换到另一个模型。

今天也发布了 Claude Mythos 5,Anthropic 表示,它“拥有与 Claude Fable 5 相同的功能,但没有安全分类器”。

这些模型的上下文窗口为 100 万个 token,最大输出 token 数为 128,000,知识截止日期为 2026 年 1 月。

它们的价格是 Claude Opus 4.5/4.6/4.7/4.8 的两倍:每百万个输入 token 10 美元,每百万个输出 token 50 美元。更长上下文使用的价格没有增加。

除此之外,升级指南比 Opus 4.8 的类似指南要简短得多。

#### 大模型的气味

描述 Fable 最好的方式是,它感觉“很大”。不仅仅是在速度和成本方面,还包括它所知道的内容之多。

以下是一个示例提示,我用它来比较 Fable 的知识与 Opus 4.8(包含拼写错误):

列出 Simon Willison 的所有开源项目,按最新发布顺序排列,每个项目附上大致的首次发布时间。

Opus 4.8 的回答如下:

我没有 Simon Willison 所有开源项目的可靠、全面且经过日期验证的列表,我想诚实地告诉你这一点,而不是冒着给你不准确的日期或虚构条目。以下是我可以合理确定的信息:Simon Willison 的知名项目:LLM(约 2023 年)——一个用于与大型语言模型进行交互的命令行工具和 Python 库。Datasette(约 2017 年)——一个用于探索和发布数据的工具,可能是他最近最突出的项目。sqlite-utils(约 2018-2019 年)——一个用于操作 SQLite 数据库的 Python 库和命令行工具,通常与 Datasette 一起使用。Django(2005 年)——他是 Django Web 框架的共同创建者之一,与 Adrian Holovaty 一起,最初是在 Lawrence Journal-World 报纸开发的。他还维护着一个大型的 Datasette 插件生态系统以及许多较小的实用工具(通常名称像 shot-scraper,各种 *-to-sqlite 工具用于导入数据等)。

这已经不错了。以下是 Fable 5 对于完全相同的提示的回答开头——两个模型都没有访问搜索功能:

我认为你指的是 Simon Willison —— 一位高产的开源开发者,Django 的联合创建者,以及 Datasette 的创建者。需要提前说明的一个重要事项是:一份真正完整的列表是不可行的。Simon Willison 以高产著称 —— 他发布了数百个仓库(仅 Datasette 就有 100 多个插件,其中许多都是他写的),而我的知识有一个截止日期,因此我会遗漏他最近的一些工作。以下是他的一些重要项目,按最近的优先排序,并附上大致的初始发布时间:重要项目(大致日期)files-to-prompt(2024 年 4 月)– 将文件合并为一个提示,用于大型语言模型(LLMs)datasette-extract(2024 年)– 使用大型语言模型提取结构化数据的插件 LLM(2023 年 5 月至 6 月)– 用于与大型语言模型交互的命令行工具和 Python 库,以及一个庞大的插件生态系统(llm-gpt4all、llm-mistral、llm-claude 等,2023 年起)symbex(2023 年 6 月)– 在 Python 代码中搜索符号的工具 ttok 和 strip-tags(2023 年 5 月)– 用于大型语言模型管道中令牌计数和 HTML 清理的命令行工具 datasette-lite(2022 年 5 月)– 通过 WebAssembly/Pyodide 在浏览器中完全运行的 Datasette shot-scraper(2022 年 3 月)– 通过 Playwright 自动截取网站截图 s3-credentials(2021 年 11 月)– 创建限定范围的 AWS S3 凭据的命令行工具 django-sql-dashboard(2021 年)– Django 的 SQL 报告仪表板 Dogsheep 套件(2019 年)– 个人分析工具:twitter-to-sqlite、github-to-sqlite、healthkit-to-sqlite、dogsheep-beta 等 sqlite-utils(2018 年)– 用于操作 SQLite 数据库的命令行工具和 Python 库 Datasette(2017 年 11 月)– 他的旗舰项目;用于探索和发布数据的工具 csvs-to-sqlite(2017 年)– 将 CSV 文件转换为 SQLite 各种早期工具(约 2007–2010 年)– soupselect、json-head、geocoders 等 Django(开发于 2003–2005 年,2005 年 7 月开源)– 与 Adrian Holovaty 在 Lawrence Journal-World 联合创建

(这里还有 GPT-5.5 作为补充。它列出的项目甚至比 Fable 还多!)

过去我曾表示,我不关心模型知道多少内容 —— 我希望它们能够以有用的方式操作文本和代码,并通过搜索工具主动查找所需的信息,而不是将这些信息硬编码到权重中。

但像这样的知识可以作为模型规模的一个合理代理 —— 你可以将关于世界更多的细节塞进更多的参数中。

知道更多的东西是否意味着模型在我们赋予它的任务上表现得更好?我当然可以想象,一个对现代库和模式有更深入了解的编码模型,可以更有效地完成编码任务。

Fable 真的比 Opus 更大吗?Anthropic 并未提及模型规模,因此我们只有茶叶(即推测),但速度、定价以及我自己对它知识的测试让我认为它是一个大型模型。也许是迄今为止任何供应商推出的最大的模型。

#### 在 Claude.ai 中使用 Fable

Anthropic 在所有他们的界面上都提供了 Fable 5 —— 包括 Claude.ai 聊天界面、网页版的 Claude Code、Claude Code CLI 和 Claude Cowork。该模型在订阅计划中“直到 6 月 22 日”可用(目前我使用的是每月 100 美元的 Max 计划),之后将额外收费。

Claude.ai 通常被低估了。自 2025 年 9 月起,每次聊天都可访问一个完整的容器环境来运行代码,包括安装额外软件包的能力,甚至可以直接从 GitHub 克隆仓库。

上周我发布了 micropython-wasm,这是一个使用 wasmtime 运行自定义构建的 MicroPython 的 Python 库,以 WebAssembly 形式运行,用作不信任 Python 代码的沙箱。

我决定看看 Fable 是否能够将该库升级为运行完整的 Python。我从这个提示开始:

从 GitHub 克隆 simonw/micropython-wasm 并研究如何使用完整的 Python 而不是 MicroPython

Fable 识别到可以使用 Brett Cannon 的 cpython-wasi-build 构建,但由于环境限制,它无法自行下载这些构建。

因此,我从该页面上获取了两个 zip 文件并上传到了 Claude:

这里是 Brett Cannon 的构建(python-3.zip_build-python-3.zip 作为附件)

就这样。它运行了几分钟,最终成功地将整个事情都运行起来。

响应的一部分包括:

我尝试了更简洁的单 zip 标准库方法,以减少文件系统表面,但 CPython 的 getpath 引导程序无法在没有更多前缀调整的情况下从 zip 中找到编码。目录预打开方法可以可靠地工作,因此 PoC 使用了这种方法。zip 路径问题是可以解决的,但需要 _PYTHONHOME /frozen-getpath 的工作。

所以我接着说:

再尝试一下单 zip 标准库问题

然后过了一会儿:

我想要一个包含整个系统的 wheel,包括 Python 封装器、WASM 文件和标准库,这样我就可以使用 uv run --with path-to-whl python -c "demo code" 来运行代码

... 它给了我这个 13.9MB 的 cpython_wasm-0.1.0-py3-none-any.whl 文件。你可以使用这个 wheel URL 和 uv 来尝试在沙箱中运行 Python 代码,如下所示:

bash
uv run --with https://static.simonwillison.net/static/cors-allow/2026/cpython_wasm-0.1.0-py3-none-any.whl \
  cpython-wasm -c
'
print(45 ** 56)
'

这是完整的聊天记录。

这是一个非常强劲的开端。

#### 使用 Claude Code 为 Datasette Agent 和 LLM 添加功能

在我意识到今天是 Fable 之前,我今天的扩展目标是为 Datasette Agent 添加一个新功能:我希望该代理软件中的工具调用能够暂停执行并在中间请求用户的直接批准。

这似乎是一个适合交给新模型处理的足够复杂的任务。

在这一天中,Fable 不仅解决了这个问题,还识别并实现了我底层 LLM 库中的四个问题,这些问题将有助于支持这种高级的暂停-恢复机制。

它首先使用一些相当复杂的 hack 方法使一切正常运行,但当我告诉它对 LLM 本身的更改在范围内时,它立即开始解开这些 hack,将它们转化为 LLM 的支持功能。

我的扩展目标变成了 LLM 0.32a3,几乎完全由 Fable 编写。以下是发布说明:

受 Datasette Agent 的 human-in-the-loop ask_user() 功能需求驱动,对工具调用的实现进行了以下改进:工具实现可以声明一个名为 llm_tool_call 的参数,以便接收当前调用的 llm.ToolCall 对象。这使它们能够访问当前的 llm_tool_call.tool_call_id。请参阅在工具内部访问工具调用。 #1480 现在每个工具调用都保证拥有一个唯一的 tool_call_id —— 如果提供者没有提供一个,将生成一个以 tc_ 为前缀的 ULID。 #1481 工具可以抛出 llm.PauseChain 异常,以干净地暂停工具链,这在等待人工批准等情况下非常有用。该异常会附带 .tool_call 和 .tool_results(已完成的兄弟结果)传播到调用者,且不会进行模型调用,而是使用一个占位符结果。请参阅在工具内部暂停链。 #1482 并发工具执行的失败语义:异步的兄弟工具调用在暂停或钩子异常传播之前始终运行到完成。 #1482 现在链可以从以未解决的工具调用结尾的 messages= 历史记录中恢复:这些调用在第一次模型调用之前通过正常的 before_call / after_call 机制执行,跳过那些已经有结果的调用。 execute_tool_calls() 方法还接受一个新的可选参数 tool_calls_list=,用于执行一个显式的 ToolCall 对象列表,而不是响应请求的调用。请参阅使用待处理的工具调用恢复链。 #1482 修复了一个错误,即异步工具执行器会静默丢弃不在 tools= 中的工具的调用——这些现在会返回 Error: tool "..." does not exist 的结果,与同步执行器一致。 #1483

我对 Fable 在此次工作中所设计的 API、测试、代码和文档的质量感到非常钦佩。我今天花了好几个小时在上面,但感觉像是做了好几天的工作。

#### 我已经投入了多少

我最近开始使用 AgentsView 来帮助跟踪我在不同编码代理上的本地 LLM 使用情况。我今天发布了一篇 TIL,关于如何向该工具添加自定义的 Fable 定价,我预计在不久的将来这将不再必要。

设置价格后,我运行了以下命令来启动一个本地 Web 服务器,以探索我的使用情况:

code
uvx agentsview serve

这是今天显示我 Fable 使用情况在不同项目之间分布的树状图:

今天我使用了价值 110.42 美元的 token,全部来自我每月 100 美元的订阅。

#### 一些鹈鹕

我使用 Fable 在所有五个思考努力级别上运行了“生成一个鹈鹕骑自行车的 SVG”。

以下是结果,包括每个级别的 token 成本:

low: 1,929 输出,9.67 美分

medium: 2,290 输出,11.475 美分

high: 2,057 输出,10.31 美分

xhigh: 5,992 输出,29.985 美分

max: 14,430 输出,72.175 美分

有趣的是,对于这次特定的运行,high 级别使用的 token 数量少于 medium 级别。

这是 Opus 4.8 的鹈鹕作为比较。

发布于晚上 11:59 · 关注我在

Mastodon

,

Bluesky

Twitter

订阅我的新闻通讯

更近的文章

  • 在 MicroPython 和 WASM 中使用沙盒运行 Python 代码 - 2026 年 6 月 6 日
  • Claude Opus 4.8:“一个谦逊但实际的改进” - 2026 年 5 月 28 日

#primary

这是 Simon Willison 的《Claude Fable 5 的初步印象》,发布于 2026 年 6 月 9 日。

ai

2,063

generative-ai

1,821

llms

1,789

anthropic

293

claude

280

llm-pricing

77

pelican-riding-a-bicycle

117

llm-release

204

claude-mythos

9

上一篇:使用 MicroPython 和 WASM 在沙箱中运行 Python 代码

月度简报

每月赞助我 10 美元,即可获得本月最重要的 LLM 发展精选电子邮件摘要。

让我少发点邮件,赞助我吧!

赞助并订阅

#secondary

#wrapper

  • 披露信息
  • 制作说明
  • ©
  • 2002
  • 2003
  • 2004
  • 2005
  • 2006
  • 2007
  • 2008
  • 2009
  • 2010
  • 2011
  • 2012
  • 2013
  • 2014
  • 2015
  • 2016
  • 2017
  • 2018
  • 2019
  • 2020
  • 2021
  • 2022
  • 2023
  • 2024
  • 2025
  • 2026

AI 可能会生成不准确的信息,请核实重要内容