不甘示弱于OpenAI，谷歌发布自家“推理”AI模型

Google 发布新 AI 模型 Gemini 2.0 Flash Thinking Experimental

Google 近期在 AI 领域动作频繁，试图在竞争中超越 OpenAI。12 月 19 日，Google 发布了其最新的 AI 模型 Gemini 2.0 Flash Thinking Experimental。该模型基于 Google 的 Gemini 2.0 Flash，并在其 AI Studio 平台上运行，采用类似于 OpenAI 的 o1 模型的运行时“推理”技术，旨在实现更深入的思考。

模型特点与早期测试

推理机制：该模型通过自我检查机制的反馈循环来提升推理能力，类似于 2023 年初的“Baby AGI”等业余项目。这种机制需要更多的计算时间，可能导致响应时间增加数秒或数分钟。
早期测试结果：TechCrunch 记者 Kyle Wiggers 的测试显示，该模型在一些基本任务上存在准确性问题，例如错误地计算单词“strawberry”中“R”的数量。

行业背景与竞争

行业趋势：自 OpenAI 于 9 月推出 o1-preview 和 o1-mini 以来，多家公司纷纷推出类似的推理模型。例如，DeepSeek 在 11 月初发布了 DeepSeek-R1，而阿里巴巴的 Qwen 团队也在本月发布了 QwQ。
Google 的投入：Google DeepMind 的首席科学家 Jeff Dean 表示，该模型获得了额外的计算资源，推理时间的增加带来了有希望的结果。

争议与挑战

实际效用与准确性：尽管推理模型在某些基准测试中表现良好，但其实际效用和准确性仍存疑。此外，运行这些模型所需的高计算成本也引发了对其长期可行性的担忧。
成本问题：例如，OpenAI 的 ChatGPT Pro 订阅费用高达每月 200 美元，部分原因就是推理模型的高计算成本。

Google 的长期目标

Google AI Studio 的员工 Logan Kilpatrick 在 X 上称，Gemini 2.0 Flash Thinking Experimental 是“我们推理之旅的第一步”，表明 Google 对这一 AI 技术的长期投入和重视。

总结

Google 通过发布 Gemini 2.0 Flash Thinking Experimental，展示了其在 AI 推理领域的雄心。尽管该模型在早期测试中表现出一些准确性问题和较高的计算成本，但 Google 显然对这一技术充满信心，并计划在未来进一步探索和优化。