90%的人在白白浪费"Token"!

TL;DR · AI 摘要
Karpathy 指出,AI 编码账单的 90% 花费在不必要的 context 上,通过优化 context 使用和路由策略,可以大幅降低成本。
核心要点
- AI 编码账单的 90% 花费在不必要的 context 上。
- 使用多模型路由策略,如 Kimi 2.6 主力,Opus 仅用于关键任务。
- 通过优化 context 和路由策略,可以显著降低 AI 编码成本。
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- AI 编码优化
- 常见浪费行为
- 自动加载文件
- 使用昂贵模型
- 优化策略
- 多模型路由
- 创建 SKILL.md
金句 / Highlights
值得收藏与分享的关键句。
Karpathy 指出,AI 编码账单的 90% 花费在不必要的 context 上。
使用多模型路由策略,如 Kimi 2.6 主力,Opus 仅用于关键任务。
通过优化 context 和路由策略,可以显著降低 AI 编码成本。
看到 @DeRonin_ 转的一条 Andrej Karpathy 的观点,看下来觉得这对天天Vibe Coding的人来说太特么扎心了!
Karpathy 直接说:“你 AI coding 账单的 90% 其实都花在了发一些根本不需要的 context 上。”
他接着列了 10" / X
Berryxia.AI on X: "90%的人在白白浪费“Token”! 看到 @DeRonin_ 转的一条 Andrej Karpathy 的观点,看下来觉得这对天天Vibe Coding的人来说太特么扎心了! Karpathy 直接说:“你 AI coding 账单的 90% 其实都花在了发一些根本不需要的 context 上。” 他接着列了 10" / X
Don’t miss what’s happening

Show translation
90%的人在白白浪费“Token”! 看到
转的一条 Andrej Karpathy 的观点,看下来觉得这对天天Vibe Coding的人来说太特么扎心了! Karpathy 直接说:“你 AI coding 账单的 90% 其实都花在了发一些根本不需要的 context 上。” 他接着列了 10 条高级工程师已经彻底不干的浪费行为,我挑几个最常见的说说: 比如以前动不动就自动把 50 个文件全塞进去改 30 行代码,结果一轮下来 1.2 美元的 token 你根本不会去读。 或者拿 Opus 去跑 lint、格式化、改名这种小活,其实 Haiku 两分钱就能搞定,贵了 30 倍。 还有 agent 每次 retry 都把整个 repo 重新发一遍,成本直接翻 5 倍。 现在大家默认用 Sonnet,结果 Kimi 2.6 在大部分 coding 任务上质量差不多,价格却只有 1/6。 还有“以防万一”把文件全扔进 prompt,8 万 token 其实 3000 就够。 每次 session 都让 agent 从头重建知识,其实写一个 SKILL.md 就能省下大把钱。 他最后说,真正能省钱又能把事情做好的,是把 context 管严、稳定前缀全开 prompt cache、用多模型路由(Kimi 2.6 当主力,Opus 只留 10% 关键任务)、把重复工作做成 SKILL.md 文件、每次先 profile 工具调用再优化 prompt。 一句话,12 个月后,拉开开发者月花费 200 美元和 4000 美元差距的,不是谁技术更牛,而是谁把 context 和 routing 玩得更明白。 值得每个重度用 AI 写代码的同学好好看看。
Quote

Ronin
@DeRonin_
·
7h
Andrej Karpathy: "90% of your AI coding bill is paying for context you didn't need to send" Here are 10 things senior AI engineers stopped wasting tokens on: 1. Auto-context loading 50 files for a 30-line fix: $1.20/turn for tokens you'll never read. 80% input waste, every x.com/DeRonin_/statu…

·
2
1
5
8