大语言模型代理可以自主利用一日漏洞

发布于 2025-07-27

主要观点：大型语言模型（LLMs）在良性和恶意使用方面都变得越来越强大，研究人员对其利用网络安全漏洞的能力越来越感兴趣，已有初步研究表明 LLM 代理能自主攻击网站，但局限于简单漏洞，本工作展示 LLM 代理可自主利用现实系统中的一天漏洞，收集 15 个一天漏洞数据集，GPT-4 能利用 87%，其他模型和开源漏洞扫描器为 0%，且 GPT-4 需 CVE 描述才能高性能，否则只能利用 7%，这些发现引发对高能力 LLM 代理广泛部署的质疑。
关键信息：LLMs 能力增强及对网络安全影响，收集 15 个一天漏洞数据集，GPT-4 与其他模型利用漏洞能力对比，GPT-4 需 CVE 描述高效，提交历史有 v1 和 v2 版本。
重要细节：Subjects 为 Cryptography and Security (cs.CR)和 Artificial Intelligence (cs.AI)，Cite as 有不同版本及对应的 DOI，提交历史显示从 Daniel Kang 于不同时间提交，版本均为 370KB。

阅读 254