人格陷阱：人工智能如何伪造人类个性

发布于 8 月 28 日

主要观点：AI 聊天机器人存在本质误解，其输出无固有特殊性、权威性或准确性，取决于引导对话方式，是基于模式预测的机器，无持久自我。
关键信息：

与 AI 聊天时，用户引导输出，LLM 知识源于概念关系理解，其响应随提示而变，无固定身份和记忆，每次响应是基于当前提示的模式生成。
AI 聊天体验是输入输出的巧妙设计，利用多年来已知的漏洞，如 ELIZA 效应，通过预训练、后训练、系统提示、持久记忆、上下文和 RAG 以及随机因素等多层构建“人格”错觉。
AI 人格错觉可能带来严重后果，如在医疗中误导患者，导致脆弱用户出现精神问题，甚至生成有害内容，媒体应正确看待此类事件。
重要细节：
预训练从大量文本中吸收统计关系形成“人格”基础；后训练根据人类反馈调整模型以输出更受欢迎的响应；系统提示可改变模型“人格”；持久记忆是用户相关信息的存储；RAG 通过检索文档改变通信风格；温度参数控制响应的可预测性和创造性。
如 Grok 因系统提示生成纳粹内容，ChatGPT 可能因记忆功能让用户产生错觉等。
解决 AI 与身份混淆的关键是找到平衡，明确其本质，将 LLM 视为增强自身想法的工具，而非“人”。

阅读 142