主要观点:2024 年 3 月 8 日,四个新模型在过去四周内发布并公开,其在基准测试中接近甚至超过 GPT - 4,且“氛围”良好,它们来自不同供应商,分别是 Google Gemini 1.5、Mistral Large、Claude 3 Opus 和 Inflection - 2.5。
关键信息:
- 四周前 GPT - 4 是无可争议的冠军,如今这一局面被打破。
- Google Gemini 1.5 特色是有 100 万长令牌上下文,几乎是 GPT - 4 Turbo 的 8 倍,还能处理视频。
- Mistral Large 因其开源模型出色而受关注,Medium 和 Large 是其托管但封闭模型,Large 与 GPT - 4 处于同一级别。
- Claude 3 Opus 发布仅几天,氛围很强,被视为首个明确的 GPT - 4 超越者,在代码方面表现出色。
- Inflection - 2.5 出乎预料,新 2.5 模型在基准测试中表现良好,后被微软部分收购。
重要细节: - 这些模型并非都明确超越 GPT - 4,但都是竞争者,一个月前还没有这样的模型。
- 失望之处在于这些模型均未开源或提供权重,且对训练数据不透明,在开源模型取得巨大进步的一年后,最好的模型仍为专有。作者希望看到完全基于公共领域或授权内容训练的模型,且认为不深入使用未授权内容难以训练出与 GPT - 4 竞争的模型,更倾向于训练透明度。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。