OWASP 标志工具被滥用作为代理式 AI 的关键威胁

OWASP 发布 Agentic AI 安全指南：今年早些时候，OWASP 发布了名为Agentic AI - Threats and Mitigations的 Agentic AI 安全指南，强调了安全部署这一新兴技术所涉及的独特挑战，并提出了缓解措施和防御架构模式。
Agents 的特点与风险：Agents 能与计算工具和服务交互，有望彻底改变系统工作流程，但这种交互也开辟了独特的攻击面。文档提出了包含内存系统、工具、规划系统和协调层四个组件的参考架构，虽识别出 15 种威胁，但多数在其他基于 LLM 的系统中存在，并非 Agentic 系统特有，这些威胁在其他 OWASP 文档中有记录。
主要新威胁 - 工具滥用：工具滥用被认定为主要新威胁，使用工具意味着若攻击者能诱使 Agent 向工具发送任意内容，就能利用工具中的所有漏洞。OWASP 定义为攻击者通过欺骗性提示和操作误导操纵 AI 代理滥用授权工具，导致未经授权的数据访问、系统操纵或资源利用。例如诱使 Agent 用错误用户凭证调用工具或以提升权限调用。
应对工具滥用的架构防御模式：指南描述了两种主要架构防御模式，一是在 Agent 和工具之间添加 AI 防火墙，专门检查输入和输出并阻止受损请求，类似 Web 应用防火墙；二是监测 Agent 的遥测流，寻找异常输入或输出并实时阻止工具使用。
重要结论：不能信任 Agents，应将来自 Agent 的请求视为来自互联网的请求。此外，OWASP 文档定义了应对所有 Agentic AI 威胁的有效缓解要求，包括严格的访问验证、行为监测、明确的操作边界和可靠的执行日志等。访问验证对 Agent 尝试使用的每个工具进行即时验证，行为监测分析工具使用模式以检测异常，操作边界定义并强制规定 Agent 允许采取的行动的严格明确限制，执行日志维护所有 AI 工具调用的防篡改日志以实现异常检测和支持事后法医审查。