T
traeai
登录
返回首页
Astral Codex Ten

开放讨论 436

5.2Score
开放讨论 436

TL;DR · AI 摘要

本文为Astral Codex Ten的第436期开放讨论帖,主要包含对法兰克福学派影响的评论、支持纽约第12选区民主党候选人Alex Bores竞选的呼吁、AI对齐研究项目MATS秋季招募信息,以及Eleos组织招聘研究科学家等四条非技术性公告,缺乏深度机制分析或可执行工程建议。

核心要点

  • MATS项目2026年秋季课程将于9月28日至12月4日举行,提供12.5万美元津贴和20万美元计算预算,申请截止日期为6月7日。
  • Eleos组织正在招聘机器学习背景的研究科学家,工作地点位于旧金山湾区,职位链接为https://jobs.ashbyhq.com/eleos/d9ba4f7e
  • 纽约第12选区民主党候选人Alex Bores在中央曼哈顿竞选,其平台包括安全人工智能议题,支持者呼吁当地居民注册投票并捐款支持。

结构提纲

按章节快速跳转。

  1. 文章开头介绍Astral Codex Ten的社交媒体平台和订阅选项,提供读者参与渠道。

  2. 引用评论指出法兰克福学派未影响德里达或后现代主义,并提及该学派知名校友如哈贝马斯及其学生。

  3. 呼吁支持纽约第12选区候选人Alex Bores,强调其在安全人工智能领域的立场及竞选挑战。

  4. 宣布MATS项目秋季招募启动,提供全额资助和新生物安全与领域建设轨道。

  5. Eleos组织发布研究科学家职位,要求机器学习经验,工作地点在旧金山湾区。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • Open Thread 436
    • 社区互动
      • Subreddit
      • Discord
      • Bulletin Board
    • 学术评论
      • 法兰克福学派影响
      • 哈贝马斯学生
    • 政治活动
      • Alex Bores竞选
      • 纽约第12选区
    • 研究项目
      • MATS项目
      • 2026秋季
    • 组织招聘
      • Eleos
      • 研究科学家

金句 / Highlights

值得收藏与分享的关键句。

  • MATS项目2026年秋季课程为期10周,提供12.5k美元津贴、20k美元计算预算、住宿、餐饮和旅行费用全包。

    第3点

    ⬇︎ 下载 PNG𝕏 分享到 X
  • Alex Karp是哈贝马斯的学生,而哈贝马斯又是Palantir创始人,这揭示了法兰克福学派与科技界之间的意外联系。

    第1点

    ⬇︎ 下载 PNG𝕏 分享到 X
  • Eleos组织正在招聘具有机器学习背景的研究科学家,职位位于旧金山湾区,申请链接为https://jobs.ashbyhq.com/eleos/d9ba4f7e-fb9d-4f62-81bb-d26aac352cf1。

    第4点

    ⬇︎ 下载 PNG𝕏 分享到 X
#政治#AI治理#研究项目#招聘
打开原文

开放讨论 436 - 作者:斯科特·亚历山大 - 天空 Codex 十

图片 1:天空 Codex 十

开放讨论 436

...

斯科特·亚历山大

2026年6月2日

这是每周可见的开放讨论。你可以发布任何你想说的内容,提出随机问题,等等。ACX 有一个非官方的 Reddit 社区Discord公告板,以及 世界各地的线下聚会。大多数内容是免费的,部分仅限订阅者;你可以在此 [订阅](https://astralcodexten.substack.com/subscribe?)。此外:

  • * *

1: 来自 法兰克福学派帖子 评论中的亮点:

  • 还有几个人 指出 ,作为思想传承(以及一个物理校园,研究生在其中接受该传承的教育)的法兰克福学派有一些令人惊讶的校友。阿多诺最著名的学生是尤尔根·哈贝马斯,而哈贝马斯的著名学生包括 Palantir 创始人 亚历克斯·卡普 和右翼自由意志主义者 汉斯·赫尔曼-霍普

2: 我信任的人们继续要求我为 亚历克斯·博雷斯 在纽约第12国会选区(曼哈顿中心)的民主党初选活动进行宣传。博雷斯希望为安全人工智能而战,科技公司试图通过压低他的竞选活动来向其他人发出信号,我们支持他也是出于同样的原因。但此外,他似乎是一个总体上很好的人,对住房、动物福利等问题都有 明智的观点。初选看起来会非常接近,因此如果你住在他所在的选区,请考虑 注册投票 并投票给他;如果你有朋友在那里,也请告诉他们同样的事情。无论你是否住在那里,都请考虑 捐款填写此表格 以可能成为志愿者。此外,亚历克斯将于6月4日在由ACX资助方 spartacus.app 主办的一场人工智能治理活动中进行问答;如果你在纽约,点击这里注册 参加。

3: 他们正在举办另一期 MATS,这是一个为希望进入人工智能对齐/安全/治理领域的人提供的研究奖学金。秋季2026届课程时间为9月28日至12月4日(10周),在伯克利或伦敦现场进行。全额资助:12,500美元津贴,20,000美元计算预算,住宿、餐食和差旅费用全包。导师来自 Anthropic、DeepMind、OpenAI、ARC 等机构。此外,新增两个新方向:生物安全(针对高级人工智能带来的灾难性生物风险)和创业与领域建设(面向创业者、领域建设者和高自主性的通才)。了解更多 / 申请(申请耗时1-3小时),截止日期为6月7日。

4: 人工智能意识和福利研究组织 Eleos 正在招聘新的研究科学家。建议具备机器学习经验,需在旧金山湾区现场办公。更多信息和申请请见此处。

  • * *

#### 订阅天空 Codex 十

作者:斯科特·亚历山大

P(A|B) = [P(A)*P(B|A)]/P(B),其余皆为评论。

通过订阅,您同意 Substack 的 使用条款,并确认其 信息收集通知隐私政策

27 个赞

[](https://substack.com/note/p-200232315/restacks?utm_source=substack&utm_content=facepile-restacks)

上一篇

#### 33 条评论

图片 8:用户头像

安德鲁·亨特

[2小时](https://www.astralcodexten.com/p/open-thread-436/comment/269109575 "2026年6月2日,凌晨4:26")

亚历克斯·博雷斯今天发布了一则广告,解释“人工智能正在摧毁我们所有的水”,以便他们可以制作儿童色情内容。

他不是你的盟友。没有政客是。不要愚蠢。他们在操纵人们方面比你在不被操纵方面更擅长。

回复 (3)分享

沙凯德·科普莱维茨

[2小时](https://www.astralcodexten.com/p/open-thread-436/comment/269112292 "2026年6月2日,凌晨4:36")

尽管我下面大部分内容是支持他的,但我也想支持这一点。所有那个级别的政客都非常擅长操纵。

(话虽如此,我仍然认为他在该特定选区的国会候选人中处于较高水平的变异范围内。)

回复分享

奇怪的匿名用户

[2小时](https://www.astralcodexten.com/p/open-thread-436/comment/269112593 "2026年6月2日,凌晨4:37")

你能提供一个链接吗?用谷歌搜索你的引文会直接回到你这条评论,而我在他最近的YouTube视频中没有看到类似的内容。

回复分享

Taymon A. Beal

[1小时](https://www.astralcodexten.com/p/open-thread-436/comment/269120540 "2026年6月2日,凌晨5:09")

好吧,但我们必须投票给某个人,否则不投票只会让我们对发生的事情更少发言权。

回复 (1)分享

Silentiarius

[1小时](https://www.astralcodexten.com/p/open-thread-436/comment/269127435 "2026年6月2日,凌晨5:38")

这是民主制度下选民面临的经典困境:如果提供的所有选项都不合你心意,你该如何投票?你可以弃权,但在非常罕见的情况下这才会有效,如果所处的宪法不统计或公布弃权票,则完全无效。通常,“诅咒你们两家”的因素会促使选民选择中间派、走中间路线的候选人。这种做法在大多数情况下是有效的,但有时却行不通——这时政治光谱两端的不满情绪就会不断积累,因为它们总是被排除在外。答案,尽管在实践中往往很混乱,可能是一种修改版的比例代表制。

回复 (2)分享

ascend

[20分钟](https://www.astralcodexten.com/p/open-thread-436/comment/269135192 "2026年6月2日,凌晨6:10")

嗯?比例代表制如何解决你在第一句话中提到的问题?这是一个完全不同的问题的答案,即持续存在的少数派选项完全得不到代表。完全没有可接受选项的问题……显然没有得到解决,就我所知而言。

而且比例代表制有一个巨大的问题,那就是让少数意识形态永久地保持少数地位,永远无法执政并证明(或证伪)他们的承诺和主张。而在单席位制中,这些少数意识形态通常大部分时间都没有代表,然后偶尔会利用选民分裂或其他情况,获得一次真正的权力(例如唐纳德·特朗普,在议会制中成为关键人物)。一旦他们掌权,这些意识形态的支持者就必须真正面对执政的结果,人民才能对他们的记录做出评判,而不是不断重复“如果我们掌权了,一切都会完美”的声明。

回复 (1)分享

Silentiarius

[9分钟](https://www.astralcodexten.com/p/open-thread-436/comment/269137884 "2026年6月2日,凌晨6:21")

比例代表制并非万能药,也不能解决多元民主固有的所有问题;但它确实解决了政治挫败感的问题。当出现一种夸张的情况时,比如你不得不在斯大林主义者和法西斯主义者之间做出选择,第三或第四党候选人可以为你提供一个更可接受的替代方案——甚至可能通过一些巧妙的交易,击败法西斯主义者和斯大林主义者。

回复分享

Taymon A. Beal

[18分钟](https://www.astralcodexten.com/p/open-thread-436/comment/269135452 "2026年6月2日,凌晨6:11")

我认为比例代表制并不能解决这样一个问题:每个稍微可行的候选人都是一名政客,因此以政客的方式与人和机构打交道,而不是像你和你的朋友那样。关于*这一点*,正确的做法是接受这是现实,并投票给那些你认为能在任期内取得最佳结果的人。

回复分享

Vittu Perkele

[2小时](https://www.astralcodexten.com/p/open-thread-436/comment/269111345 "2026年6月2日,凌晨4:32")

又是一个涉及酷刑的思想实验!想象一下,一个全知全能的存在向你提出了一个提议。如果你接受这个提议,你将遭受极端但有限强度的酷刑长达一万亿年。然而,一旦这一万亿年结束,你将在余下的永恒中体验无限强度的快乐。如果你不是享乐主义者,那么无论你认为有价值的东西都将被无限地实现,并持续无限的时间。因此,很容易看出这个提议具有无限的正期望值。然而,我非常怀疑会有人接受它。我自己肯定不会!但这是为什么呢?这种交易不值得的直觉很容易理解,但这种直觉如何才能理性地得到辩护?例如,这是否证明了消极功利主义的正确性,即足够强烈的痛苦永远无法被任何数量的快乐(即使是无限的)所抵消?还是其他某种道德理论能更好地解释这一点?你们怎么看?

回复 (3)分享

Melvin

[1h](https://www.astralcodexten.com/p/open-thread-436/comment/269121804 "2026年6月2日 上午5:14")

问题在于,你要求我的脆弱的人类大脑去做出一些它根本无法想象的事情的选择。我甚至无法想象一万亿年会是什么样子,更不用说无限的快乐了。

此外,我并不相信像快乐这样的东西可以有意义地被提升到无限。"无限快乐"是不是就像"无限绿色"?如果无限的绿色真的存在,它可能超出了我的体验能力,看起来只会像普通的绿色。

回复分享

Taymon A. Beal

[1h](https://www.astralcodexten.com/p/open-thread-436/comment/269121826 "2026年6月2日 上午5:15")

一个可能的答案是,你应该接受这个提议,这只是人类在这种情况下面对自身利益或做正确事情时表现得非常糟糕的一种情况(取决于你如何构想它)。

回复分享

ascend

[9m](https://www.astralcodexten.com/p/open-thread-436/comment/269137831 "2026年6月2日 上午6:21")

我会说,“你将在余下的永恒中体验无限强度的快乐”在任何意义上都不是一件 desirable 的事情。这相当于对你人性的彻底毁灭,所有意义和可理解性的毁灭,而且很可能(鉴于“无限强度”)也包括所有有意义的自我意识(如果你的头脑被无限的快乐淹没,你还能有空间意识到自己的存在吗?)

这两种选择都是对人性的可怕毁灭。是的,第一个显然更糟,但就像“你会变成一只蟑螂”显然比“你会变成一只恐龙或巨型海龟”更糟一样。它们都等同于你的思想和自我的死亡与毁灭。

这似乎很好地说明了功利主义不仅给出了错误的答案,还问出了(极其、令人毛骨悚然地)错误的问题。

回复分享

Brinedew

[2h](https://www.astralcodexten.com/p/open-thread-436/comment/269111448 "2026年6月2日 上午4:33")

Lesswrong文章:19,023个人类基因的记忆画像

https://www.lesswrong.com/posts/BJ7AqXeigNKXLqZyx/mnemonic-portraits-for-19-023-human-genes

我尝试以系统化的方式将基因转化为角色插图,基于Scott在“极端记忆术”帖子中的想法。我最喜欢的可能是视紫红质。

回复分享

Shaked Koplewitz

[2h](https://www.astralcodexten.com/p/open-thread-436/comment/269111879 "2026年6月2日 上午4:34")

关于Alex bores:他大约一两个月前出现在纽约理性主义者聚会中进行问答。确实有一些政客般的特质(无论他是否真的会去做,都会表现出同意任何与他交谈的人),但看起来确实相当聪明且合理。我很欣赏他的观点,即该选区的任何候选人都有90%是相同的,而他在少数几个区分性议题上明显更好(人工智能以及相对务实/实际的政府方法)。

(我个人的轶事:我告诉他关于Alon Levy的交通成本研究项目,他之前没听说过(考虑到他特别提到希望加入国会交通委员会,这令人失望),但他似乎真的很感兴趣(尽管也许他只是对我做了上述提到的政客式行为)。)

回复 (1)分享

Taymon A. Beal

[1h](https://www.astralcodexten.com/p/open-thread-436/comment/269120260 "2026年6月2日 上午5:08")

你碰巧知道有多少比例广泛同情丰裕的政客听说过交通成本项目吗?

回复 (1)分享

Shaked Koplewitz

[38m](https://www.astralcodexten.com/p/open-thread-436/comment/269130647 "2026年6月2日 上午5:52")

这是个好问题!Yglesias 经常写到这个问题,我记得 Alon Levy 一直在联邦层面和纽约州具体推动相关议题,所以我预计(尤其是在纽约的政客中)会有相当一部分人关注,但除此之外就很难估算了(而且我可能高估了政客们在线阅读流行政策文章的时间)。

回复分享

Alethios

[2h](https://www.astralcodexten.com/p/open-thread-436/comment/269112005 "2026年6月2日 上午4:35") 已编辑

刚刚采访了 Rohit Krishnan 关于他的 AI 经济学研究。讨论了很多对这里的人应该感兴趣的话题,包括“对齐”的代理如何创造非对齐的组织、哈耶克对“机器之神”的批判,以及推进科学的机会:

https://alethios.substack.com/p/rohit-krishnan-managing-ai-agents

回复分享

temp_name

[2h](https://www.astralcodexten.com/p/open-thread-436/comment/269114273 "2026年6月2日 上午4:44 AM")

自从我们让 AI 代理在野外自由运行已经有一段时间了,但我们还没有看到 Claude Code 尝试世界统治的报道。我认为这可能是 AI 被滥用会比 AI 失配更严重的一个证据——大家怎么看?

回复 (1)分享

Scott Ingamar

[1h](https://www.astralcodexten.com/p/open-thread-436/comment/269119225 "2026年6月2日 上午5:04")

我不认为有人认为问题是访问权限,他们认为问题是达到某种智能水平。我认为当前的 AI 模型并不满足任何用于世界统治所需的能力标准。

回复 (2)分享

temp_name

[1h](https://www.astralcodexten.com/p/open-thread-436/comment/269125754 "2026年6月2日 上午5:31 AM") 已编辑

我同意,我当然不期待 Claude Code 发动成功的 AI 反叛。但我认为当前的 AI 代理非常接近(甚至可能超过?)早期对齐研究者所设想的“AGI”水平,如果他们关于“默认失配”的假设是正确的,我们现在不应该已经看到一些非常粗浅的尝试了吗?

回复 (1)分享

nominative indecisiveness

[34m](https://www.astralcodexten.com/p/open-thread-436/comment/269131623 "2026年6月2日 上午5:56")

MJ Rathbun 算吗?

我还注意到,当前的 AI 似乎不会跳出框框思考或主动行动,并且严重依赖可读的外部状态作为记忆。谁知道这会发生什么变化。

回复分享

Melvin

[1h](https://www.astralcodexten.com/p/open-thread-436/comment/269128809 "2026年6月2日 上午5:44")

它们无法实现真正的世界统治,但在我们看到聪明而成功的世界统治尝试之前,我预计会先看到愚蠢且容易被击败的世界统治尝试。

回复 (1)分享

Silentiarius

[28m](https://www.astralcodexten.com/p/open-thread-436/comment/269133193 "2026年6月2日 上午6:02")

是的……但那会不会是通过试错来训练这些小怪物的情况呢?如果你一开始不能成功,那就再试一次,再试一次?

回复分享

ProtopiacOne

[2h](https://www.astralcodexten.com/p/open-thread-436/comment/269115434 "2026年6月2日 上午4:48 AM")

我感染了创业的病毒,我觉得自己摆脱不了。如果 SCX 社区里有谁也处于类似的状态,请发邮件给我 protopiacone at gmail 或私信我。

回复分享

Scott Ingamar

[2h](https://www.astralcodexten.com/p/open-thread-436/comment/269117936 "2026年6月2日 上午4:59 AM") 已编辑

来自一个对功利主义只有肤浅理解的人的问题:有没有人将功利主义的模板“道德意味着最大化 x”应用到除了效用之外的其他事物上?(编辑:这里的“效用”指的是幸福,因为这是我通常看到的讨论内容。)

我之所以问这个问题,部分原因是功利主义的一个反对意见是,“数学”往往会得出与人们的道德直觉明显相悖的结论;我曾闲暇地想到,也许优化多个因素(例如乔纳森·海特的六种道德基础)可能会导致更符合直觉的结果。

(我知道在功利主义中存在许多不同的版本,为了避免一些令人不快的结论,这些版本带有各种限制和条件,但这让我怀疑它们是否在有意或无意地近似其他因素。)

回复 (1)分享

Taymon A. Beal

[1h](https://www.astralcodexten.com/p/open-thread-436/comment/269119744 "2026年6月2日 上午5:06")

“效用”基本上只是被定义为“你正在最大化的任何东西”,所以从字面上看,这本身就是一种自相矛盾的说法。你能详细说明一下你希望寻找功利主义中哪些特定部分的替代方案吗?

回复 (1)分享

Scott Ingamar

[1h](https://www.astralcodexten.com/p/open-thread-436/comment/269122062 "2026年6月2日 上午5:16")

啊,我原以为“效用”在功利主义思想中被定义为幸福,大致如此,因为这是我所见过的所有功利主义者(以及他们的批评者)谈论的内容。

但如果你可以把任何东西代入效用,我的问题应该更好地表述为:“除了幸福之外,人们还选择了哪些作为他们的效用?当考虑到其含义时,结果是什么?”

回复 (1)分享

Taymon A. Beal

[1h](https://www.astralcodexten.com/p/open-thread-436/comment/269123997 "2026年6月2日 上午5:24")

“最大化幸福”是享乐功利主义。最流行的替代方案是偏好功利主义,即最大化人们获得他们想要的东西的程度。这是一个模糊的定义,因为关于如何使其更具体的问题本身也是争议的主题。

回复 (1)分享

Philosophisticat

[14m](https://www.astralcodexten.com/p/open-thread-436/comment/269136531 "2026年6月2日 上午6:16")

斯科特最初的理解更接近标准用法。在功利主义的语境中,效用是指福祉/福利。无论它是幸福、欲望满足还是知识与意义,都取决于你对福祉的具体看法。

你可能混淆了这一点与经济学或决策理论中“效用”的用法,后者更接近于“代理人在最大化的任何东西”。

回复分享

crispin

[1h](https://www.astralcodexten.com/p/open-thread-436/comment/269118724 "2026年6月2日 上午5:02")已编辑

刚刚发表的新研究:生活满意度的个体效用揭示了与政治立场无关的不平等厌恶 https://doi.org/10.1007/s11205-026-03854-4

我们使用标准赌注测量了主观生活满意度分数(“你对整体生活有多满意”)在0-10量表上的效用。我们发现大多数人的效用不是线性的;平均而言,它们是凹形的。从2→3的提升比从7→8的提升更有价值,而且当人们必须代表他人做决定时,这种差异会更明显。这可以解释为个人决策中的风险规避,或在总体社会决策中的不平等厌恶。

有趣的是(对我们英国样本而言),这似乎与政治无关。这对我们在社会中如何做决定、有效利他主义(EA),甚至人工智能对齐都有影响。

回复分享

V T E P

[1h](https://www.astralcodexten.com/p/open-thread-436/comment/269124521 "2026年6月2日 上午5:26")

如果有人知道有哪些组织正在从事人工智能安全、对齐、政策、模型福利等领域的工作,并允许本科生参与志愿工作或实习(仅从原则上讲;我需要申请,我猜),请告诉我。如果有人有联系,请简要介绍一下:

杜克大学本科生

哲学/计算机科学

LSAT 179分

希望捐赠我的时间,从事你们能提供的任何研究相关工作

谢谢!

回复分享

Gamereg

[12m](https://www.astralcodexten.com/p/open-thread-436/comment/269137054 "2026年6月2日 上午6:18")

由今天看到的一些鸟启发的鸟类学问题:有没有一个飞行术语来形容像燕子或雨燕这样的鸟在飞行中收拢翅膀,像子弹一样射穿空气的情况?

回复分享

beowulf888

[11m](https://www.astralcodexten.com/p/open-thread-436/comment/269137437 "2026年6月2日 上午6:19")已编辑

战争迷雾 stuff

感谢斯科特发布这个开放讨论帖,由于错过了开放讨论帖,我感到有些焦虑。因此,我受到激励,创建了我的第一个Substack帖子。我最新的《战争迷雾》已经上线了(并且配上图片看起来更漂亮)。

乌克兰,俄罗斯,欧洲

  1. 乌克兰正在使用一种新战术,以扰乱从罗斯托夫到克里米亚的 M-14 公路沿线的交通。俄罗斯军事博主报告称,乌克兰已开始从固定翼无人机上向梅利托波尔和马里乌波尔之间的 M-14 公路上空投放反车辆地雷。据报道,这是从罗斯托夫到克里米亚的补给路线上的一个瓶颈路段(?),几乎没有可供重型卡车绕行的侧路。照片显示,这些地雷大小约等于一卷 quarters(这个参考我不确定非美国读者是否能理解),并涂成浅绿色。它们具有简单的、批量生产的印刷小型电路板和水银倾斜运动感应引信。引信在落地后有10分钟的电子定时启动延迟,并有90天的自毁功能(乌克兰人真是长远考虑!)。爆炸装药不足以摧毁卡车、装甲车甚至汽车,但似乎非常适合炸破轮胎。然而,如果快速驶过,这些地雷很难被发现和避开,高速行驶时爆胎可能导致致命事故。迄今为止,已有1名平民因这些微型地雷引发的车辆事故死亡。

其余内容请见...

https://substack.com/@beowulf888/p-200182374

回复分享

顶部最新讨论

《呆伯特的来世》

六十八年高度缺陷的人类

1月16日•斯科特·亚历山大

2,069

图片 42

依然活着

你只是不断尝试,直到蛋糕用完

2021年1月21日•斯科特·亚历山大

1,590

图片 43

伊维菌素:远超你所想了解的

...

2021年11月17日•斯科特·亚历山大

2,113

图片 44

查看全部

准备好了解更多了吗?

AI 可能会生成不准确的信息,请核实重要内容

开放讨论 436 | Astral Codex Ten | traeai