GPT-4 的壁垒终于被打破

主要观点:2024 年 3 月 8 日,四个新模型在过去四周内发布并公开,其在基准测试中接近甚至超过 GPT - 4,且“氛围”良好,它们来自不同供应商,分别是 Google Gemini 1.5、Mistral Large、Claude 3 Opus 和 Inflection - 2.5。
关键信息

  • 四周前 GPT - 4 是无可争议的冠军,如今这一局面被打破。
  • Google Gemini 1.5 特色是有 100 万长令牌上下文,几乎是 GPT - 4 Turbo 的 8 倍,还能处理视频。
  • Mistral Large 因其开源模型出色而受关注,Medium 和 Large 是其托管但封闭模型,Large 与 GPT - 4 处于同一级别。
  • Claude 3 Opus 发布仅几天,氛围很强,被视为首个明确的 GPT - 4 超越者,在代码方面表现出色。
  • Inflection - 2.5 出乎预料,新 2.5 模型在基准测试中表现良好,后被微软部分收购。
    重要细节
  • 这些模型并非都明确超越 GPT - 4,但都是竞争者,一个月前还没有这样的模型。
  • 失望之处在于这些模型均未开源或提供权重,且对训练数据不透明,在开源模型取得巨大进步的一年后,最好的模型仍为专有。作者希望看到完全基于公共领域或授权内容训练的模型,且认为不深入使用未授权内容难以训练出与 GPT - 4 竞争的模型,更倾向于训练透明度。
阅读 23
0 条评论