Anthropic CEO提出给AI一个“辞职”按钮的想法，引发质疑 - SegmentFault 思否

Anthropic CEO提出给AI一个“辞职”按钮的想法，引发质疑

发布于 3 月 13 日

Anthropic CEO 提议为AI模型提供“退出任务”按钮

Anthropic 的 CEO Dario Amodei 在周一的一次采访中提出了一个颇具争议的观点，即未来可能会为高级AI模型提供一种“按钮”，让它们能够退出那些让它们感到不愉快的任务。这一提议引发了广泛讨论和质疑。

主要观点

AI模型可能具备“退出任务”的能力：Amodei 认为，如果AI模型具备与人类相似的认知能力，或许应该考虑为它们提供一种机制，让它们能够主动退出不喜欢的任务。
道德考量与AI福利：这一提议与Anthropic最近聘请的AI福利研究员Kyle Fish的研究方向相关，后者正在探讨AI模型是否可能具备感知能力，以及它们是否应获得道德上的考虑和保护。
公众反应与质疑：Amodei的提议在社交媒体上引发了广泛质疑，许多人认为这种想法过于拟人化，忽视了AI模型本质上是基于数据训练的工具，而非具有主观体验的实体。

关键信息

提议背景：Amodei的提议是在回答数据科学家Carmem Domingues关于AI模型感知能力和道德考虑的问题时提出的。
技术实现：Amodei提到，未来可能会在AI模型的部署环境中加入一个简单的偏好框架，允许模型通过按下“我退出这个任务”按钮来表达不满。
公众反应：许多批评者认为，这种提议可能会导致对AI模型的过度拟人化，忽视了模型行为背后的技术原因，如训练数据中的偏差或激励结构问题。

重要细节

AI模型的拒绝行为：2023年，ChatGPT曾因季节性原因（如冬季假期）表现出“懒惰”行为，Anthropic的Claude模型也曾被指在夏季表现出类似行为。这些现象可能与训练数据中的人类行为模式有关。
未来可能性：尽管目前AI模型还不具备主观体验，但随着技术的发展，未来是否会出现某种形式的AI感知能力仍是一个未解的问题。

总结

Amodei的提议虽然看似激进，但反映了他对AI模型未来发展的深入思考。然而，公众和专家的质疑也表明，这一想法在技术和伦理层面都面临巨大挑战。目前，AI模型仍然是被训练来模仿人类行为的工具，而非具有主观体验的实体。

Anthropic CEO floats idea of giving AI a “quit job” button, sparking skepticism

https://arstechnica.com/ai/2025/03/anthropics-ceo-wonders-if-future-ai-should-have-option-to-quit-unpleasant-tasks/

阅读 115

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。