谷歌的Gemma 3是一款开源、单GPU AI,拥有128K上下文窗口

Google 发布最新 AI 模型 Gemma 3

Google 最新发布的 AI 模型 Gemma 3 在追求高效的同时,也具备强大的性能。该模型专为开发者设计,旨在在各种环境中运行,从数据中心到智能手机均可适用。Gemma 3 是开源的,开发者可以立即进行实验和调整。

主要特点

  1. 高效性:Gemma 3 被称为“世界上最好的单加速器模型”,能够在单个 GPU 或 AI 加速器上运行,适合本地处理。
  2. 多模态能力:基于专有的 Gemini 2.0 基础,Gemma 3 能够处理文本、高分辨率图像和视频。
  3. 扩展的上下文窗口:上下文窗口从之前的 8,192 个 token 扩展到 128,000 个 token,能够处理更多数据。
  4. 图像安全解决方案:Google 推出了 ShieldGemma 2,可以与 Gemma 集成,帮助屏蔽危险、色情或暴力等不受欢迎的图像。

模型版本

Gemma 3 提供多种版本,适应不同的硬件需求:

  • 1B 版本:仅处理文本,参数为 10 亿,几乎可以在任何设备上运行,内存占用小于 1GB。
  • 4B 和 12B 版本:中等规模,适合更高性能需求。
  • 27B 版本:参数为 270 亿,需要 20GB–30GB 内存,即使在 4 位精度下。

性能表现

根据 Google 提供的数据,Gemma 3 在多个方面表现出色:

  • 聊天能力:使用 Elo 指标衡量用户偏好,Gemma 3 27B 在聊天能力上超越了 Gemma 2、Meta Llama3 和 OpenAI o3-mini 等模型,但略逊于 DeepSeek R1。
  • 数学、编码和复杂指令:Google 声称 Gemma 3 在这些方面表现更佳,但未提供具体数据支持。

获取与使用

Gemma 3 已在 Google AI Studio 上线,开发者可以使用 Google Colab 和 Vertex AI 等工具进行微调,或直接使用自己的 GPU。模型可以从 Kagle 和 Hugging Face 等平台免费下载,但 Google 的许可协议限制了使用范围。

社区与应用

Google 推出了“Gemmaverse”社区,展示基于 Gemma 模型构建的应用程序,为开发者提供灵感和支持。

总结

Gemma 3 是 Google 推出的高效、多模态 AI 模型,适合各种硬件环境,特别适合本地处理。尽管在性能上与其他顶级模型相比略有差距,但其高效性和灵活性使其成为开发者的有力工具。

阅读 8 (UV 8)
0 条评论