GPT-4 的壁垒终于被打破

发布于 2025-07-27

主要观点：2024 年 3 月 8 日，四个新模型在过去四周内发布并公开，其在基准测试中接近甚至超过 GPT - 4，且“氛围”良好，它们来自不同供应商，分别是 Google Gemini 1.5、Mistral Large、Claude 3 Opus 和 Inflection - 2.5。
关键信息：

四周前 GPT - 4 是无可争议的冠军，如今这一局面被打破。
Google Gemini 1.5 特色是有 100 万长令牌上下文，几乎是 GPT - 4 Turbo 的 8 倍，还能处理视频。
Mistral Large 因其开源模型出色而受关注，Medium 和 Large 是其托管但封闭模型，Large 与 GPT - 4 处于同一级别。
Claude 3 Opus 发布仅几天，氛围很强，被视为首个明确的 GPT - 4 超越者，在代码方面表现出色。
Inflection - 2.5 出乎预料，新 2.5 模型在基准测试中表现良好，后被微软部分收购。
重要细节：
这些模型并非都明确超越 GPT - 4，但都是竞争者，一个月前还没有这样的模型。
失望之处在于这些模型均未开源或提供权重，且对训练数据不透明，在开源模型取得巨大进步的一年后，最好的模型仍为专有。作者希望看到完全基于公共领域或授权内容训练的模型，且认为不深入使用未授权内容难以训练出与 GPT - 4 竞争的模型，更倾向于训练透明度。

阅读 76