OpenAI 发布 GPT-4o mini
OpenAI 于周四宣布推出 GPT-4o mini,这是其最新 AI 语言模型 GPT-4o 的缩小版,将取代 ChatGPT 中的 GPT-3.5 Turbo。该模型将从即日起免费提供给 ChatGPT 的普通用户以及 ChatGPT Plus 或 Team 订阅用户,并将在下周面向 ChatGPT Enterprise 用户开放。
主要特性
- 多模态能力:GPT-4o mini 与 GPT-4o 一样具备多模态能力,目前已在 API 中启用图像输入功能。未来,该模型还将能够处理图像、文本和音频,并生成图像。
- 上下文支持:GPT-4o mini 支持 128K 的输入上下文,知识截止日期为 2023 年 10 月。
- 成本优势:作为 API 产品,GPT-4o mini 的成本比 GPT-3.5 Turbo 低 60%,输入和输出每百万 tokens 的成本分别为 0.15 美元和 0.60 美元。
- 指令层级技术:这是 OpenAI 首个采用“指令层级”技术的 AI 模型,该技术能够使模型优先处理某些指令,从而降低用户进行提示注入攻击、越狱或系统提示提取的可能性。
性能表现
OpenAI 表示,GPT-4o mini 在多个基准测试中表现优异,如 MMLU(本科水平知识)和 HumanEval(编码)。然而,这些基准测试的实际意义有限,因为它们无法完全反映模型在实际使用中的表现。OpenAI 还称,GPT-4o mini 在 LMSYS Chatbot Arena 排行榜上超越了去年的 GPT-4 Turbo,但用户反馈显示,尽管 GPT-4o 在排行榜上表现更好,但其输出在实际应用中往往不够实用。
小型语言模型的价值
OpenAI 并非首个推出小型语言模型的公司。Meta、Google 和 Anthropic 等公司也常发布小型模型,旨在以更低的成本执行更简单的任务,如生成列表、总结或建议词汇,而非进行深度分析。
- 成本效益:小型模型通常面向 API 用户,这些用户按 tokens 输入和输出付费。OpenAI 将 GPT-4o mini 免费提供给 ChatGPT 用户,也有助于降低其自身成本。
- 参数与性能:小型模型通常参数较少,这意味着其神经网络较小,限制了模型理解上下文的能力。然而,参数数量与模型能力之间并非总是直接相关,训练数据的质量、模型架构的效率和训练过程本身也影响模型性能。
总结
GPT-4o mini 的推出标志着 OpenAI 在降低 AI 成本和提高效率方面迈出了重要一步。尽管其性能在基准测试中表现优异,实际应用中的表现仍需进一步验证。小型语言模型在特定任务中具有显著的成本优势,但其能力与大型模型相比仍有一定差距。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。