90%的人在白白浪费"Token"！

AI HOT 精选

AI HOT 精选2026年5月12日

90%的人在白白浪费"Token"！

8.5Score

TL;DR · AI 摘要

Karpathy 指出，AI 编码账单的 90% 花费在不必要的 context 上，通过优化 context 使用和路由策略，可以大幅降低成本。

核心要点

AI 编码账单的 90% 花费在不必要的 context 上。
使用多模型路由策略，如 Kimi 2.6 主力，Opus 仅用于关键任务。
通过优化 context 和路由策略，可以显著降低 AI 编码成本。

结构提纲

按章节快速跳转。

§引言
Karpathy 指出，AI 编码账单的 90% 花费在不必要的 context 上。
·常见浪费行为
列举了一些常见的浪费行为，如自动加载大量文件、使用昂贵的模型进行简单任务等。
·优化策略
提出了一些优化策略，如使用多模型路由、创建 SKILL.md 文件等。
§总结
通过优化 context 和路由策略，可以显著降低 AI 编码成本。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

AI 编码优化
- 常见浪费行为
  - 自动加载文件
  - 使用昂贵模型
- 优化策略
  - 多模型路由
  - 创建 SKILL.md

金句 / Highlights

值得收藏与分享的关键句。

Karpathy 指出，AI 编码账单的 90% 花费在不必要的 context 上。
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X
使用多模型路由策略，如 Kimi 2.6 主力，Opus 仅用于关键任务。
— 第 3 段
⬇︎ 下载 PNG 𝕏 分享到 X
通过优化 context 和路由策略，可以显著降低 AI 编码成本。
— 第 4 段
⬇︎ 下载 PNG 𝕏 分享到 X

#AI 编码#context 优化#token 管理

打开原文

看到 @DeRonin_ 转的一条 Andrej Karpathy 的观点，看下来觉得这对天天Vibe Coding的人来说太特么扎心了！

Karpathy 直接说：“你 AI coding 账单的 90% 其实都花在了发一些根本不需要的 context 上。”

他接着列了 10" / X

Berryxia.AI on X: "90%的人在白白浪费“Token”！看到 @DeRonin_ 转的一条 Andrej Karpathy 的观点，看下来觉得这对天天Vibe Coding的人来说太特么扎心了！ Karpathy 直接说：“你 AI coding 账单的 90% 其实都花在了发一些根本不需要的 context 上。” 他接着列了 10" / X

Don’t miss what’s happening

Berryxia.AI

@berryxia

Show translation

90%的人在白白浪费“Token”！看到

@DeRonin_

转的一条 Andrej Karpathy 的观点，看下来觉得这对天天Vibe Coding的人来说太特么扎心了！ Karpathy 直接说：“你 AI coding 账单的 90% 其实都花在了发一些根本不需要的 context 上。” 他接着列了 10 条高级工程师已经彻底不干的浪费行为，我挑几个最常见的说说：比如以前动不动就自动把 50 个文件全塞进去改 30 行代码，结果一轮下来 1.2 美元的 token 你根本不会去读。或者拿 Opus 去跑 lint、格式化、改名这种小活，其实 Haiku 两分钱就能搞定，贵了 30 倍。还有 agent 每次 retry 都把整个 repo 重新发一遍，成本直接翻 5 倍。现在大家默认用 Sonnet，结果 Kimi 2.6 在大部分 coding 任务上质量差不多，价格却只有 1/6。还有“以防万一”把文件全扔进 prompt，8 万 token 其实 3000 就够。每次 session 都让 agent 从头重建知识，其实写一个 SKILL.md 就能省下大把钱。他最后说，真正能省钱又能把事情做好的，是把 context 管严、稳定前缀全开 prompt cache、用多模型路由（Kimi 2.6 当主力，Opus 只留 10% 关键任务）、把重复工作做成 SKILL.md 文件、每次先 profile 工具调用再优化 prompt。一句话，12 个月后，拉开开发者月花费 200 美元和 4000 美元差距的，不是谁技术更牛，而是谁把 context 和 routing 玩得更明白。值得每个重度用 AI 写代码的同学好好看看。

Quote

Ronin

@DeRonin_

·

7h

Andrej Karpathy: "90% of your AI coding bill is paying for context you didn't need to send" Here are 10 things senior AI engineers stopped wasting tokens on: 1. Auto-context loading 50 files for a 30-line fix: $1.20/turn for tokens you'll never read. 80% input waste, every x.com/DeRonin_/statu…

11:13 PM · May 12, 2026

·

1,271 Views

2

1

5

8