- OWASP 发布 Agentic AI 安全指南:今年早些时候,OWASP 发布了名为Agentic AI - Threats and Mitigations的 Agentic AI 安全指南,强调了安全部署这一新兴技术所涉及的独特挑战,并提出了缓解措施和防御架构模式。
 - Agents 的特点与风险:Agents 能与计算工具和服务交互,有望彻底改变系统工作流程,但这种交互也开辟了独特的攻击面。文档提出了包含内存系统、工具、规划系统和协调层四个组件的参考架构,虽识别出 15 种威胁,但多数在其他基于 LLM 的系统中存在,并非 Agentic 系统特有,这些威胁在其他 OWASP 文档中有记录。
 - 主要新威胁 - 工具滥用:工具滥用被认定为主要新威胁,使用工具意味着若攻击者能诱使 Agent 向工具发送任意内容,就能利用工具中的所有漏洞。OWASP 定义为攻击者通过欺骗性提示和操作误导操纵 AI 代理滥用授权工具,导致未经授权的数据访问、系统操纵或资源利用。例如诱使 Agent 用错误用户凭证调用工具或以提升权限调用。
 - 应对工具滥用的架构防御模式:指南描述了两种主要架构防御模式,一是在 Agent 和工具之间添加 AI 防火墙,专门检查输入和输出并阻止受损请求,类似 Web 应用防火墙;二是监测 Agent 的遥测流,寻找异常输入或输出并实时阻止工具使用。
 - 重要结论:不能信任 Agents,应将来自 Agent 的请求视为来自互联网的请求。此外,OWASP 文档定义了应对所有 Agentic AI 威胁的有效缓解要求,包括严格的访问验证、行为监测、明确的操作边界和可靠的执行日志等。访问验证对 Agent 尝试使用的每个工具进行即时验证,行为监测分析工具使用模式以检测异常,操作边界定义并强制规定 Agent 允许采取的行动的严格明确限制,执行日志维护所有 AI 工具调用的防篡改日志以实现异常检测和支持事后法医审查。
 
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用@来通知其他用户。