不甘示弱于OpenAI,谷歌发布自家“推理”AI模型

Google 发布新 AI 模型 Gemini 2.0 Flash Thinking Experimental

Google 近期在 AI 领域动作频繁,试图在竞争中超越 OpenAI。12 月 19 日,Google 发布了其最新的 AI 模型 Gemini 2.0 Flash Thinking Experimental。该模型基于 Google 的 Gemini 2.0 Flash,并在其 AI Studio 平台上运行,采用类似于 OpenAI 的 o1 模型的运行时“推理”技术,旨在实现更深入的思考。

模型特点与早期测试

  • 推理机制:该模型通过自我检查机制的反馈循环来提升推理能力,类似于 2023 年初的“Baby AGI”等业余项目。这种机制需要更多的计算时间,可能导致响应时间增加数秒或数分钟。
  • 早期测试结果:TechCrunch 记者 Kyle Wiggers 的测试显示,该模型在一些基本任务上存在准确性问题,例如错误地计算单词“strawberry”中“R”的数量。

行业背景与竞争

  • 行业趋势:自 OpenAI 于 9 月推出 o1-previewo1-mini 以来,多家公司纷纷推出类似的推理模型。例如,DeepSeek 在 11 月初发布了 DeepSeek-R1,而阿里巴巴的 Qwen 团队也在本月发布了 QwQ
  • Google 的投入:Google DeepMind 的首席科学家 Jeff Dean 表示,该模型获得了额外的计算资源,推理时间的增加带来了有希望的结果。

争议与挑战

  • 实际效用与准确性:尽管推理模型在某些基准测试中表现良好,但其实际效用和准确性仍存疑。此外,运行这些模型所需的高计算成本也引发了对其长期可行性的担忧。
  • 成本问题:例如,OpenAI 的 ChatGPT Pro 订阅费用高达每月 200 美元,部分原因就是推理模型的高计算成本。

Google 的长期目标

Google AI Studio 的员工 Logan Kilpatrick 在 X 上称,Gemini 2.0 Flash Thinking Experimental 是“我们推理之旅的第一步”,表明 Google 对这一 AI 技术的长期投入和重视。

总结

Google 通过发布 Gemini 2.0 Flash Thinking Experimental,展示了其在 AI 推理领域的雄心。尽管该模型在早期测试中表现出一些准确性问题和较高的计算成本,但 Google 显然对这一技术充满信心,并计划在未来进一步探索和优化。

阅读 8
0 条评论