主要观点:
- 作者使用 OpenAI 的 o3 模型在 Linux 内核中发现零日漏洞 CVE-2025-37899,该漏洞是 SMB“注销”命令处理程序中的使用后释放漏洞。
- 通过手动发现的 CVE-2025-37778 漏洞作为 o3 能力的基准,测试 o3 能找到的漏洞,o3 在 100 次运行中找到该漏洞 8 次,优于 Claude Sonnet 3.7。
- 给 o3 所有命令处理程序的代码时,它能找到类似但新的漏洞,如会话注销处理程序中的漏洞,作者意识到之前修复该漏洞的方法不足,o3 的报告有价值。
- LLM 比其他程序分析技术更接近人类,o3 能在漏洞研究中提升人类性能,但仍不完美,有生成无意义结果的可能。
关键信息:
- o3 无需复杂工具,仅通过 o3 API 找到漏洞,其发现的漏洞 CVE-2025-37899 是 Linux 内核中的使用后释放漏洞。
- CVE-2025-37778 是 Kerberos 身份验证路径中的使用后释放漏洞,需要确定触发条件等,约 3.3k LoC 可涵盖相关代码。
- 评估 o3 性能时,给它特定代码,如“会话设置”命令处理程序的代码约 3.3k LoC,o3 在 100 次运行中找到 CVE-2025-37778 漏洞 8 次,优于 Claude Sonnet 3.7。
- 给 o3 所有命令处理程序的代码约 12k LoC 时,它能找到新漏洞,作者意识到之前修复漏洞的方法不足,o3 的报告有价值。
重要细节:
- ksmbd 是在内核空间实现 SMB3 协议的 Linux 内核服务器。
- o3 找到的漏洞 CVE-2025-37899 影响 SMB“注销”命令处理程序,涉及并发连接和对象共享。
- 评估 o3 性能时,明确如何让自动化系统选择函数给 LLM 看,避免随意性。
- o3 找到的新漏洞在会话注销处理程序中,存在同步问题导致使用后释放漏洞。
- LLM 比其他程序分析技术更接近人类,o3 能提升漏洞研究中的人类性能,但仍有不足。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。