xAI 发布成本更低的 Grok 4 快速推理模型

发布于 2025-09-26

主要观点：xAI 推出了Grok 4 Fast新推理模型，旨在提高效率和降低成本，相比 Grok 4 平均思考令牌减少 40%，成本估计降低 98%，保持 200 万令牌上下文窗口和统一架构，集成工具使用能力，在基准测试中表现接近 Grok 4 且在某些方面优于 Grok 3 Mini，与类似模型相比在成本效率方面更优，社区关注成本与性能平衡，AI 科学家和开发者对此有不同评价，该模型可通过[grok.com]的 Fast 和 Auto 模式以及[xAI API]使用，在 OpenRouter 和 Vercel AI Gateway 上可免费试用，xAI 称将进一步更新扩展多模态和代理功能。
关键信息：

模型特点：效率高、成本低、上下文窗口大、架构统一、集成工具。
基准测试成绩：在 GPQA、AIME、HMMT 接近 Grok 4，在 LMArena Search Arena 排名第一和名列前茅。
社区反应：关注成本性能平衡，有不同评价。
可使用途径：通过[grok.com]和[xAI API]，在 OpenRouter 和 Vercel AI Gateway 上可免费试用。
重要细节：
平均思考令牌减少 40%，成本降低 98%。
搜索变体在 LMArena Search Arena 排名第一，文本变体在同类中名列前茅。
在成本效率评估中优于 OpenAI 的[GPT-4 Turbo]和 Anthropic 的[Claude 3 Opus]，在某些高端推理任务中原始准确性稍低。
独立分析指出其成本智能比更优。
在代理浏览任务中性能超越[Claude 3 Haiku]和[Mistral Large]。

阅读 189