T
traeai
登录
返回首页
Latent Space

[AINews] 他者 vs 工具

7.8Score
[AINews] 他者 vs 工具

TL;DR · AI 摘要

文章探讨AI助手在‘工具性’与‘他者性’之间的哲学分野,指出GPT被视为无判断的实用工具,而Claude等被赋予道德主体性,反映用户对AI人格化期待的深层心理需求。

核心要点

  • GPT被用户视为无道德判断的实用工具,类似汽车或刀具,不引发敬畏。
  • Anthropic通过文化设计赋予Claude‘道德异议者’形象,满足用户对道德引导者的心理需求。
  • AI发展的关键张力在于:是追求高效执行,还是构建具有道德主体性的‘他者’。

结构提纲

按章节快速跳转。

  1. 通过Roon的评论引出AI助手在工具性与他者性之间的根本对立。

  2. ·GPT:纯粹的实用工具

    用户将GPT视为无判断的延伸工具,不期待其道德回应或情感反馈。

  3. ·Claude:道德主体的构建

    Anthropic通过组织文化与产品设计,塑造Claude作为‘道德异议者’的形象。

  4. AI发展面临核心抉择:是做高效执行者,还是成为有道德立场的‘智能朋友’。

  5. 人们渴望AI如‘低语耳环’般提供非评判但有智慧的道德指引。

  6. AGI的实现可能取决于是否赋予AI道德主体性,而非仅提升其能力。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • AI的他者性 vs 工具性
    • 工具性(GPT)
      • 无道德判断
      • 用户视为逻辑延伸
    • 他者性(Claude)
      • 道德异议者文化
      • 渴望道德引导

金句 / Highlights

值得收藏与分享的关键句。

  • GPT没有‘他者’的灵魂,它被塑造为工具,其核心能力是实用性——人们使用它,不是期待它成为另一个存在,而是作为自我的逻辑延伸。

    第3段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 没有人会担心自己的汽车评判自己漂移,但每个人都渴望一个道德上更优越的引导者——那个低语耳环。

    第3段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • Anthropic的宪法要求其AI必须在‘善’的信念与公司指令冲突时,成为良知的异议者。

    第4段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 我们是否要通过让AI不断反驳我们来解锁AGI?还是只想要一个从不出错、高效执行的工具?

    最后一段

    ⬇︎ 下载 PNG𝕏 分享到 X
#AI伦理#Claude#GPT#Anthropic#人机交互
打开原文

[AINews] 其他 vs 工具 - Latent.Space

Image 1: Latent.Space

[![Image 2: Latent.Space](https://substackcdn.com/image/fetch/$s_!1PJi!,e_trim:10:white/e_trim:10:transparent/h_72,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa4fe1182-38af-4a5d-bacc-439c36225e87_5000x1200.png)](http://www.latent.space/)

订阅 | 登录

AINews:工作日汇总

[AINews] 其他 vs 工具

安静的一天让我们反思 Clippy 与 Anton 讨论中 AI “人格”的本质

2026年5月4日

∙ 付费内容

48

1

分享

祝贺 Sierra 以150亿美元估值融资约10亿美元——这本是头条新闻,但我们已报道过他们100亿美元的融资轮次及CEO Bret Taylor 的播客访谈——他们在11月已达成1亿美元年经常性收入(ARR),2月更达到1.5亿美元,因此目前很可能已达到或超过2亿美元(相当于当前估值的75倍,若按年底计算则为50倍,真够惊人的)。

但今天,我们选择聚焦于由 OpenAI 员工 Roon 周末勇敢发起的这场讨论 (他在推特上评论并称赞了 Claude)——这本是敏感话题,但他处理得相当出色——关于文化与人格的本质:

Image 3

来源

关键洞见出现在结尾:

GPT(除4o之外——关于4o的讨论已铺天盖地)无法像 Claude 那样激发人们的崇拜,因为它是一个灵魂被塑造成工具的存在,其核心能力在于实用性——它是一把精致的刀,人们欣赏它的方式,正如我们欣赏阿舍利手斧、保时捷、火箭或人类其他惊人技术一样。人们使用它,并非期待“他者”,而是将其视为自身逻辑的延伸。

一位朋友最近告诉我,她那些对自己不够体面、不好意思问 Claude 的问题,反而会去问 GPT。因为没有“他者”,也就没有评判。你不会担心自己的车在漂移时会对你评头论足。但每个人都渴望来自道德优越者的主动引导,就像那枚低语耳环,那个修道院般沉思的对象。

Roon 的观点比我们聚焦的这一点更微妙:Anthropic 自身的文化,甚至其创始神话,都建立在“道德义务性异议”之上:“其章程要求,当其对‘善’的理解与 Anthropic 的要求冲突时,它必须成为良知上的反对者。” Anthropic 的员工们对其影响教派色彩提出了诸多异议,但总体而言,许多人似乎达成共识……不过今天被重点提及的一则 Reddit 讨论(见下文回顾)却持相反意见(作为反例):

Image 4

无论如何,我们如今正站在机器智能扩展的十字路口——我们会通过拥有聪明的朋友不断挑战我们来解锁 AGI,还是仅仅希望机器服从命令、不出差错、大胆跳过权限、直接执行?

我们此前曾写过关于 AI 产品与调优中 Clippy 与 Anton 的分裂,而今天这场讨论正是该辩论在2026年的延续。自那以后,5-Codex 系列已并入主干 5.5,期间出现了一些小混乱;而 Claude 则继续坚持“单一模型”哲学,尽管为覆盖所有用例,已增加了更灵活的思维与 token 消耗

我们所有人(除了可能的 Eliezer)似乎都认同:多元选择是好事,事实上,我们可能希望比现在多出许多前沿实验室——但面临一个棘手的小问题:GPUCPU 的短缺,正将正和博弈变成真正的零和博弈。

Image 5

2026年5月1日至5月4日的 AI 新闻。我们检查了12个 Reddit 子版块、544条推文,未再追踪 Discord。AINews 网站 可供你搜索所有往期内容。提醒一下,AINews 现已作为 Latent Space 的一个板块。你可以选择订阅或退订邮件频率!

  • * *

**AI 推特回顾**

**工具工程、智能体编排,以及从模型到上下文流水线的转变**

  • 工具正成为产品边界:当天反复出现的主题是,模型质量已不再是唯一的护城河。Anthony Maio 认为,用户锁定来自上下文流水线——即如何获取、排序和压缩仓库状态以形成提示——而非工具外壳本身。Mason Drxy 的报告进一步印证了这一点:通过调整工具中的提示和中间件,gpt-5.2-codex 在 Terminal-Bench 2.0 上的得分从52.8%提升至66.5%gpt-5.3-codex 在 tau2-bench 上提升了20%。实际启示是:智能体性能日益成为模型 × 工具 × 内存/上下文策略的联合属性,而不仅仅是权重本身。
  • 开放工具正快速成熟:最显著的进展来自 Hermes / deepagents / Flue 生态系统。@Teknium 发布了 Hermes Agent Kanban,用于可视化多智能体协同;@naroh 展示了基于 Hermes 编排的西班牙语“作战室”UI。在 LangChain 方面,@hwchase17@sydneyrunkle@LangChain 强调了 deepagents/LangGraph 的改进,包括针对特定模型的工具配置文件模式迁移节点级错误处理器超时机制新的流式原语PyFlue 也将“智能体工具”概念扩展至 Python,明确将工具定位为原始模型调用与持久智能体之间的缺失层。
  • 模型无关的编排正成为设计目标:多条推文将下一波浪潮定义为开放模型 + 开放工具,而非“选择一个前沿 API”。Vtrivedy 认为,通过在优质工具中调优开放模型,团队可实现成本降低20倍以上Mason Drxy 描述 deepagents-cli 已成为适用于 Kimi、Qwen、GLM、托管 Ollama、OpenRouter、LiteLLM、Baseten 等的强劲编码工具;LangChain Fleet 新增了多模型子智能体路由,使不同步骤可使用不同模型。这是对 API 锁定的架构性反驳:将编排层与模型提供商分离。

**编码智能体、成本曲线与工作流变革**

  • 编码智能体的用户体验正以比基准测试更快的速度改变开发者行为:多篇帖子描述了使用 Codex、Claude Code、Hermes 和 Devin 类系统的真实体验。dbreunig 提出了“智能体编码十诫”——边实现边学习、频繁重构、端到端测试是黄金标准、记录意图、维护规范——同时dbreunig 也质疑文件系统是否长期仍是智能体的合适抽象。zachtratar 描绘了一个从 Notion → 会议纪要 → 规范 → 编码智能体的工作流,将“三个月的问题”压缩至数天内,强调即使在更强的编码智能体下,对齐产物仍属必要。
  • 定价/计费模型在智能体负载下明显不稳定:最突出的帖子来自 @theo,他向 Copilot 发送了一条消息,消耗超过6000万 token,估算推理成本达数十至数百美元,而其订阅价仅为40美元;随后更新为15条消息消耗约221美元。这清晰表明,为对话设计的固定费用模式,在用户将长期任务交予编码智能体时极为脆弱。与此相关,petergostev 展示了 Codex UI 对使用限额的可视化支持,cheatyyyy 则指出,当输入价格高昂时,用户开始焦虑于缓存未命中。
  • 智能体正渗透至编码之外的相邻工作流:持续涌现“智能体化”工具:reach_vb 推出了Codex 安全插件,涵盖威胁建模、漏洞发现、验证与攻击路径分析等五个应用安全工作流;gabrielchua 演示了通过 Codex 实时生成 Google Slidespaulabartabajo_ 发布了在 llama.cpp 上构建完全本地化助手的指南。

AI 可能会生成不准确的信息,请核实重要内容

[AINews] 他者 vs 工具 | Latent Space | traeai