主要观点:OpenAI 发布了 GPT - 5 - Codex,专为复杂软件工程任务优化,可在 Codex 云服务中默认使用且能自主运行超 7 小时。其具有自适应推理功能,根据任务复杂度调整推理时间,在不同交互场景和任务类型中表现不同,如在代码重构任务中准确率高于 GPT - 5,还能强化代码审查工作流,在评估中表现出色。该模型通过强化学习在真实编码任务中训练,可遵循项目特定指南,开发者可通过 Codex CLI 和 IDE 扩展访问。
关键信息:
- GPT - 5 - Codex 是 GPT - 5 针对复杂软件工程任务的优化版本,可在 Codex 云环境等使用。
- 具有自适应推理,能根据任务调整推理时间,交互方式和处理任务类型不同表现各异。
- 在代码重构任务中准确率达 51.3%,高于 GPT - 5 的 33.9%,能处理大型多文件代码修改。
- 训练用于强化代码审查工作流,能导航仓库等并生成更准确高价值评论。
- 由强化学习在真实编码任务中训练,可遵循 AGENTS.md 文件中的项目指南。
- 开发者可通过 Codex CLI 和 IDE 扩展访问,API 密钥访问即将推出。
重要细节: - 可在 Codex 的云服务中默认使用,能自主运行超 7 小时无需人工干预。
- 对最简单 10%请求使用 tokens 减少 93.7%,最复杂 10%请求推理时间约为两倍。
- 如在 Duolingo 的后端 Python 代码审查基准中表现最佳,能发现其他 bot 错过的问题。
- 在 Cisco Meraki 中可用于更新代码库,减轻开发者负担并保证进度。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用@来通知其他用户。