xAI 发布成本更低的 Grok 4 快速推理模型

主要观点:xAI 推出了Grok 4 Fast新推理模型,旨在提高效率和降低成本,相比 Grok 4 平均思考令牌减少 40%,成本估计降低 98%,保持 200 万令牌上下文窗口和统一架构,集成工具使用能力,在基准测试中表现接近 Grok 4 且在某些方面优于 Grok 3 Mini,与类似模型相比在成本效率方面更优,社区关注成本与性能平衡,AI 科学家和开发者对此有不同评价,该模型可通过[grok.com]的 Fast 和 Auto 模式以及[xAI API]使用,在 OpenRouter 和 Vercel AI Gateway 上可免费试用,xAI 称将进一步更新扩展多模态和代理功能。
关键信息:

  • 模型特点:效率高、成本低、上下文窗口大、架构统一、集成工具。
  • 基准测试成绩:在 GPQA、AIME、HMMT 接近 Grok 4,在 LMArena Search Arena 排名第一和名列前茅。
  • 社区反应:关注成本性能平衡,有不同评价。
  • 可使用途径:通过[grok.com]和[xAI API],在 OpenRouter 和 Vercel AI Gateway 上可免费试用。
    重要细节:
  • 平均思考令牌减少 40%,成本降低 98%。
  • 搜索变体在 LMArena Search Arena 排名第一,文本变体在同类中名列前茅。
  • 在成本效率评估中优于 OpenAI 的[GPT-4 Turbo]和 Anthropic 的[Claude 3 Opus],在某些高端推理任务中原始准确性稍低。
  • 独立分析指出其成本智能比更优。
  • 在代理浏览任务中性能超越[Claude 3 Haiku]和[Mistral Large]。
阅读 78
0 条评论