Gary Marcus(@GaryMarcus)
PLEASE DO NOT PANIC about the Mythos/METR graph that everyone is panicking about. Progress is being...
5.5Score

TL;DR · AI 摘要
Gary Marcus认为关于Mythos/METR图谱的恐慌是过度反应,强调图谱仅表示50%的成功率,而非完全成功。
核心要点
- 关于Mythos/METR图谱的恐慌是过度反应。
- 图谱仅表示50%的成功率。
- Mythos可能基于Claude Code的一些学习成果。
#Mythos#METR#Gary Marcus
打开原文Gary Marcus 在 X 上:“关于大家都在恐慌的 Myths/METR 图表,请不要惊慌”
不要错过正在发生的事情

请不要惊慌关于大家都在恐慌的 Myths/METR 图表。虽然取得了进展,但人们反应过度了。这里是一些评论中遗漏的背景信息。
引用

@GaryMarcus
·
13小时前
对 METR 新图表的快速点评,今天很多人都在热议。•Claude Code 是一个真正的进步;Mythos 可能在此基础上有所发展。但是……•如果你仔细阅读图表,它关注的是实现 *50%* 的成功率。不是 100% 或 99% 甚至 90%。x.com/metr_evals/sta…
15
2
26
7
阅读 15 条回复