OpenAI推出GPT-4o mini，将取代ChatGPT中的GPT-3.5

OpenAI 发布 GPT-4o mini

OpenAI 于周四宣布推出 GPT-4o mini，这是其最新 AI 语言模型 GPT-4o 的缩小版，将取代 ChatGPT 中的 GPT-3.5 Turbo。该模型将从即日起免费提供给 ChatGPT 的普通用户以及 ChatGPT Plus 或 Team 订阅用户，并将在下周面向 ChatGPT Enterprise 用户开放。

主要特性

多模态能力：GPT-4o mini 与 GPT-4o 一样具备多模态能力，目前已在 API 中启用图像输入功能。未来，该模型还将能够处理图像、文本和音频，并生成图像。
上下文支持：GPT-4o mini 支持 128K 的输入上下文，知识截止日期为 2023 年 10 月。
成本优势：作为 API 产品，GPT-4o mini 的成本比 GPT-3.5 Turbo 低 60%，输入和输出每百万 tokens 的成本分别为 0.15 美元和 0.60 美元。
指令层级技术：这是 OpenAI 首个采用“指令层级”技术的 AI 模型，该技术能够使模型优先处理某些指令，从而降低用户进行提示注入攻击、越狱或系统提示提取的可能性。

性能表现

OpenAI 表示，GPT-4o mini 在多个基准测试中表现优异，如 MMLU（本科水平知识）和 HumanEval（编码）。然而，这些基准测试的实际意义有限，因为它们无法完全反映模型在实际使用中的表现。OpenAI 还称，GPT-4o mini 在 LMSYS Chatbot Arena 排行榜上超越了去年的 GPT-4 Turbo，但用户反馈显示，尽管 GPT-4o 在排行榜上表现更好，但其输出在实际应用中往往不够实用。

小型语言模型的价值

OpenAI 并非首个推出小型语言模型的公司。Meta、Google 和 Anthropic 等公司也常发布小型模型，旨在以更低的成本执行更简单的任务，如生成列表、总结或建议词汇，而非进行深度分析。

成本效益：小型模型通常面向 API 用户，这些用户按 tokens 输入和输出付费。OpenAI 将 GPT-4o mini 免费提供给 ChatGPT 用户，也有助于降低其自身成本。
参数与性能：小型模型通常参数较少，这意味着其神经网络较小，限制了模型理解上下文的能力。然而，参数数量与模型能力之间并非总是直接相关，训练数据的质量、模型架构的效率和训练过程本身也影响模型性能。

总结

GPT-4o mini 的推出标志着 OpenAI 在降低 AI 成本和提高效率方面迈出了重要一步。尽管其性能在基准测试中表现优异，实际应用中的表现仍需进一步验证。小型语言模型在特定任务中具有显著的成本优势，但其能力与大型模型相比仍有一定差距。