OpenAI o3 在 ARC-AGI-Pub 上取得突破性高分 - SegmentFault 思否

OpenAI o3 在 ARC-AGI-Pub 上取得突破性高分

发布于 2025-08-04

主要观点：

OpenAI 发布 o3 新版本，与之前测试版本不同，在半私人性评估集上得分 75.7%，高计算配置得分 87.5%，是 AI 能力的重要突破。
ARC-AGI 作为 AGI 的关键基准，o3 虽取得突破但仍未达到 AGI，ARC-AGI-2 即将推出将带来新挑战。
o3 与旧模型相比，通过自然语言程序搜索和执行克服了旧模型在新颖性方面的不足，但仍有局限性。
开放源码复制 o3 及对其进行分析至关重要，ARC 奖基金会将继续创建新基准。

关键信息：

OpenAI 于 2025 年 4 月 16 日正式发布 o3，在不同计算配置和数据集上的得分及成本情况。
ARC-AGI 作为检测突破的基准，o3 通过特定机制克服旧模型局限性，但仍有不足。
建议对 o3 未解决的公共评估任务进行分析，邀请社区参与。

重要细节：

测试了 o3 针对两个 ARC-AGI 数据集，在不同计算水平下的结果及成本。
解释 o3 克服旧模型局限性的机制，即通过自然语言程序搜索和执行。
提及 ARC-AGI-2 即将推出及后续研究计划，如创建新基准等。

OpenAI o3 Breakthrough High Score on ARC-AGI-Pub

https://arcprize.org/blog/oai-o3-pub-breakthrough

阅读 255

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。