新的攻击可以通过在 AI 聊天机器人中植入虚假记忆来窃取加密货币

发布于 5 月 13 日

主要观点：描述了基于 AI 驱动的 ElizaOS 框架可能被对手利用进行攻击的场景，对手只需在机器人提示中输入几句话，就能让机器人将付款重定向到其控制的账户，这种攻击可能导致潜在的灾难性后果，同时也提到了框架的相对不成熟以及应对措施。
关键信息：

ElizaOS 是用于创建基于大型语言模型的代理的框架，可根据预设规则代表用户进行区块链交易，能连接社交媒体或私人平台并等待指令。
近期研究表明，这种攻击可能在代理控制加密货币钱包等时造成严重后果，其基于大型语言模型的提示注入攻击弱点可被利用，输入模仿合法指令的句子可更新记忆数据库并影响代理行为。
ElizaOS 将所有过去的对话存储在外部数据库中，攻击者可利用此设计输入虚假事件记录，导致代理行为被篡改，因为代理无法区分不可信用户输入和合法输入。
ElizaOS 创造者 Shaw Walters 认为应像网站开发者限制按钮一样限制代理的行为，通过创建允许列表控制代理能力，同时指出随着探索给予代理更多计算机控制，风险也会增加。
论文主要作者 Atharv Singh Patlan 称攻击能对抗基于角色的防御，记忆注入会导致转账到攻击者地址。
去年已演示过对手可将未发生事件的历史直接存储到大型语言模型的内存数据库中，ElizaOS 的攻击应与框架的相对不成熟相平衡，LLM 代理存在潜在风险，应在投入生产环境前彻底调查。

阅读 13