主要观点:大型语言模型(LLMs)在良性和恶意使用方面都变得越来越强大,研究人员对其利用网络安全漏洞的能力越来越感兴趣,已有初步研究表明 LLM 代理能自主攻击网站,但局限于简单漏洞,本工作展示 LLM 代理可自主利用现实系统中的一天漏洞,收集 15 个一天漏洞数据集,GPT-4 能利用 87%,其他模型和开源漏洞扫描器为 0%,且 GPT-4 需 CVE 描述才能高性能,否则只能利用 7%,这些发现引发对高能力 LLM 代理广泛部署的质疑。
关键信息:LLMs 能力增强及对网络安全影响,收集 15 个一天漏洞数据集,GPT-4 与其他模型利用漏洞能力对比,GPT-4 需 CVE 描述高效,提交历史有 v1 和 v2 版本。
重要细节:Subjects 为 Cryptography and Security (cs.CR)和 Artificial Intelligence (cs.AI),Cite as 有不同版本及对应的 DOI,提交历史显示从 Daniel Kang 于不同时间提交,版本均为 370KB。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。