T
traeai
登录
返回首页
AI HOT 精选

90%的人在白白浪费"Token"!

8.5Score
90%的人在白白浪费"Token"!

TL;DR · AI 摘要

Karpathy 指出,AI 编码账单的 90% 花费在不必要的 context 上,通过优化 context 使用和路由策略,可以大幅降低成本。

核心要点

  • AI 编码账单的 90% 花费在不必要的 context 上。
  • 使用多模型路由策略,如 Kimi 2.6 主力,Opus 仅用于关键任务。
  • 通过优化 context 和路由策略,可以显著降低 AI 编码成本。

结构提纲

按章节快速跳转。

  1. Karpathy 指出,AI 编码账单的 90% 花费在不必要的 context 上。

  2. 列举了一些常见的浪费行为,如自动加载大量文件、使用昂贵的模型进行简单任务等。

  3. 提出了一些优化策略,如使用多模型路由、创建 SKILL.md 文件等。

  4. 通过优化 context 和路由策略,可以显著降低 AI 编码成本。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • AI 编码优化
    • 常见浪费行为
      • 自动加载文件
      • 使用昂贵模型
    • 优化策略
      • 多模型路由
      • 创建 SKILL.md

金句 / Highlights

值得收藏与分享的关键句。

#AI 编码#context 优化#token 管理
打开原文

看到 @DeRonin_ 转的一条 Andrej Karpathy 的观点,看下来觉得这对天天Vibe Coding的人来说太特么扎心了!

Karpathy 直接说:“你 AI coding 账单的 90% 其实都花在了发一些根本不需要的 context 上。”

他接着列了 10" / X

Berryxia.AI on X: "90%的人在白白浪费“Token”! 看到 @DeRonin_ 转的一条 Andrej Karpathy 的观点,看下来觉得这对天天Vibe Coding的人来说太特么扎心了! Karpathy 直接说:“你 AI coding 账单的 90% 其实都花在了发一些根本不需要的 context 上。” 他接着列了 10" / X

Don’t miss what’s happening

Image 2

Berryxia.AI

@berryxia

Show translation

90%的人在白白浪费“Token”! 看到

@DeRonin_

转的一条 Andrej Karpathy 的观点,看下来觉得这对天天Vibe Coding的人来说太特么扎心了! Karpathy 直接说:“你 AI coding 账单的 90% 其实都花在了发一些根本不需要的 context 上。” 他接着列了 10 条高级工程师已经彻底不干的浪费行为,我挑几个最常见的说说: 比如以前动不动就自动把 50 个文件全塞进去改 30 行代码,结果一轮下来 1.2 美元的 token 你根本不会去读。 或者拿 Opus 去跑 lint、格式化、改名这种小活,其实 Haiku 两分钱就能搞定,贵了 30 倍。 还有 agent 每次 retry 都把整个 repo 重新发一遍,成本直接翻 5 倍。 现在大家默认用 Sonnet,结果 Kimi 2.6 在大部分 coding 任务上质量差不多,价格却只有 1/6。 还有“以防万一”把文件全扔进 prompt,8 万 token 其实 3000 就够。 每次 session 都让 agent 从头重建知识,其实写一个 SKILL.md 就能省下大把钱。 他最后说,真正能省钱又能把事情做好的,是把 context 管严、稳定前缀全开 prompt cache、用多模型路由(Kimi 2.6 当主力,Opus 只留 10% 关键任务)、把重复工作做成 SKILL.md 文件、每次先 profile 工具调用再优化 prompt。 一句话,12 个月后,拉开开发者月花费 200 美元和 4000 美元差距的,不是谁技术更牛,而是谁把 context 和 routing 玩得更明白。 值得每个重度用 AI 写代码的同学好好看看。

Quote

Image 3

Ronin

@DeRonin_

·

7h

Andrej Karpathy: "90% of your AI coding bill is paying for context you didn't need to send" Here are 10 things senior AI engineers stopped wasting tokens on: 1. Auto-context loading 50 files for a 30-line fix: $1.20/turn for tokens you'll never read. 80% input waste, every x.com/DeRonin_/statu…

Image 4

11:13 PM · May 12, 2026

·

1,271 Views

2

1

5

8

AI 可能会生成不准确的信息,请核实重要内容