谷歌的Gemma 3是一款开源、单GPU AI，拥有128K上下文窗口 - SegmentFault 思否

谷歌的Gemma 3是一款开源、单GPU AI，拥有128K上下文窗口

发布于 3 月 13 日

Google 发布最新 AI 模型 Gemma 3

Google 最新发布的 AI 模型 Gemma 3 在追求高效的同时，也具备强大的性能。该模型专为开发者设计，旨在在各种环境中运行，从数据中心到智能手机均可适用。Gemma 3 是开源的，开发者可以立即进行实验和调整。

主要特点

高效性：Gemma 3 被称为“世界上最好的单加速器模型”，能够在单个 GPU 或 AI 加速器上运行，适合本地处理。
多模态能力：基于专有的 Gemini 2.0 基础，Gemma 3 能够处理文本、高分辨率图像和视频。
扩展的上下文窗口：上下文窗口从之前的 8,192 个 token 扩展到 128,000 个 token，能够处理更多数据。
图像安全解决方案：Google 推出了 ShieldGemma 2，可以与 Gemma 集成，帮助屏蔽危险、色情或暴力等不受欢迎的图像。

模型版本

Gemma 3 提供多种版本，适应不同的硬件需求：

1B 版本：仅处理文本，参数为 10 亿，几乎可以在任何设备上运行，内存占用小于 1GB。
4B 和 12B 版本：中等规模，适合更高性能需求。
27B 版本：参数为 270 亿，需要 20GB–30GB 内存，即使在 4 位精度下。

性能表现

根据 Google 提供的数据，Gemma 3 在多个方面表现出色：

聊天能力：使用 Elo 指标衡量用户偏好，Gemma 3 27B 在聊天能力上超越了 Gemma 2、Meta Llama3 和 OpenAI o3-mini 等模型，但略逊于 DeepSeek R1。
数学、编码和复杂指令：Google 声称 Gemma 3 在这些方面表现更佳，但未提供具体数据支持。

获取与使用

Gemma 3 已在 Google AI Studio 上线，开发者可以使用 Google Colab 和 Vertex AI 等工具进行微调，或直接使用自己的 GPU。模型可以从 Kagle 和 Hugging Face 等平台免费下载，但 Google 的许可协议限制了使用范围。

社区与应用

Google 推出了“Gemmaverse”社区，展示基于 Gemma 模型构建的应用程序，为开发者提供灵感和支持。

总结

Gemma 3 是 Google 推出的高效、多模态 AI 模型，适合各种硬件环境，特别适合本地处理。尽管在性能上与其他顶级模型相比略有差距，但其高效性和灵活性使其成为开发者的有力工具。

Google’s Gemma 3 is an open source, single-GPU AI with a 128K context window

https://arstechnica.com/gadgets/2025/03/googles-new-gemma-3-ai-model-is-optimized-to-run-on-a-single-gpu/

阅读 111

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。