一图读懂 Google Cloud Next ’24 图文双版同步上线❤️
4 月 9 - 11 日,Google Cloud Next ’24 在拉斯维加斯举办。在这场技术盛会上,Google Cloud 接连推出了大量以生成式 AI 为中心的产品和服务,包括基础架构、大语言模型、平台、创新加速工具以及 Agent 层面的创新。
现在,和我们一起回顾精华内容,收获技术新知。
基础架构层🥇
Google Cloud 宣布推出面向生成式 AI 时代的超级计算机架构 AI Hypercomputer,提供端到端的基础设施,从硬件到软件的一切服务。
我们正处于行业的关键时刻,我们正在重塑基础设施以支持 AI 新时代。
——Google Cloud CEO Thomas Kurian
日益强大的基础硬件
- 推出自研 Arm 架构 CPU 处理器 Axion: Google 首款专为数据中心设计、基于 Arm 的定制 CPU,与当前基于 x86 的同类实例相比, 性能提升高达 50%,能效最多可提升 60%。
- 全面推出 TPU v5p: 每个 Pod 的计算能力较上一代提高了 4 倍,是 Google 用于训练和推理的最强大、可扩展且灵活的 AI 加速器。
- 新增 A3 Mega 计算单元: 其带宽为 A3 实例的 2 倍,能支持要求最严苛的工作负载。
- 即将推出新的 NVIDIA HGX B200 与 NVIDIA GB200 NVL72 芯片实例: 其中 GB200 NVL72 可为万亿参数规模的模型提供实时大语言模型推理和大规模训练。
- 推出 Cloud Storage FUSE 和 Parallelstore 全新的缓存功能: 进一步提升训练速度。
- 推出 Hyperdisk ML: 其模型加载速度较常见替代方案提高了 3.7 倍。
持续开放的开源软件
- Max Diffusion:各种 Diffusion 模型参考实现的集合,可在 XLA 设备上运行。
- Jetstream:一个运行生成式 AI 模型的新引擎,可为 Gemma 7B 和 Meta 的 Llama 2 等模型提供高达 3 倍的性价比。
- MaxText:一个针对云中的 TPUs 和 NVIDIA GPUs 的文本生成 AI 模型的集合,可以根据开发人员的需求进行定制和微调。
大语言模型层💎
Google 模型架构上的最新创新使得 Gemini 1.5 Pro 能够更快学习复杂任务,并保持更高质量输出,同时能更高效进行训练和部署。
Gemini 1.5 pro 实现了任何大规模基础模型中最长的上下文窗口。更长的上下文窗口将带来更多可能性,帮助开发人员构建更有用的模型和应用程序。
——Google and Alphabet CEO Sundar Pichai
- Gemini 1.5 Pro 提供迄今为止最大的上下文窗口:支持多达 100 万个token,现已推出公共预览版。这意味着 Gemini 1.5 Pro 可自如地处理 1 小时的视频、11 小时的音频、超过 3 万行代码或超过 70 万字的代码库。
- Gemini Code Assist 获得内部成功:可将开发人员常见开发任务的时间提高 40% 以上,编写新代码的时间减少大约 55%。
- Gemma 迎来 CodeGemma 和 RecurrentGemma 两个新的变体模型:CodeGemma 面向开发人员和企业提供更高性能、更轻量化的代码生成服务,RecurrentGemma 可为研究人员提供更高效、更快速的批量推理服务。
平台层🔍
模型之上,Vertex AI 平台是出海企业和开发者们最关心的部分。
Vertex AI 是企业级 AI 平台,位于我们世界一流的基础设施之上。它是唯一一个让客户发现、定制、扩充、部署和管理一代人工智能模型的统一平台。
——Google Cloud CEO Thomas Kurian
- 更丰富的模型选择:Vertex AI Model Garden 中目前已有超过 130 种第一方与第三方模型,包括 Anthropic 全新系列的 Claude 3,现已在 Vertex AI 上向客户开放使用。
- 更先进的生图技术:Imagen 2 能轻松生成如 GIF 等动图,支持图像修复、图像扩展等高级照片编辑功能,并且配备安全筛选与数字水印。
- 更准确的数据应用:用户可通过两种新方式提高生成结果的质量,一种是 Google Search,另一种是用户自己的数据源,如 Workday 或 Salesforce 等企业应用程序,以及 AlloyDB 和 BigQuery 等 Google 数据库。
- 更强大的安全功能:Google Cloud 安全产品组合中的创新功能可以为威胁情报和安全运营提供更强大的安全防护。其中 Gemini in Security Operations 全新辅助调查功能可以通过对话式聊天引导使用者在平台上进行启动检测、总结事件数据、建议应采取的行动。
创新加速工具⌛️
在 Google Workspace 上最重要的创新是 Google Vids。
如果你能制作幻灯片,你就可以在 Vids 中制作视频,而不需要视频制作的经验。
——Workspace 协作应用程序产品管理副总裁 Kristina Behr
- Google Vids 可以帮助用户生成视频内容的分镜脚本、选择风格、编辑草稿,同时还提供预录制的旁白功能,并支持项目的安全协作和共享,预计在 6 月登陆 Workspace Labs。
Agent 应用层🧩
借助丰富多样的 AI 产品组合,比如基础架构、Gemini、多种模型与 Vertex AI 等,客户与合作伙伴可以打造日渐精密的 AI Agent,用来服务客户、支持员工和创造内容等。
Vertex AI Agent Builder 允许人们非常轻松快捷地构建 Agent,您可以构建并部署生产就绪的、生成式 AI 驱动的 Agent,并像指导人类一样指导它们,以提高模型答案的质量和正确性。
——Google Cloud CEO Thomas Kurian
- 客服 Agent :洲际酒店集团将推出由生成式 AI 驱动的旅行规划功能,协助客户轻松规划下一趟度假行程。
- 员工 Agent:Etsy 使用 Vertex AI 训练技术来优化搜索建议与广告模型,为买家提供更好的商品推荐,并提升销售额。
- 创意 Agent:家乐福使用 Vertex AI 开创营销新方法,使他们能够在数周内在不同社交网络上高效创建动态活动,吸引消费者。
- 数据 Agent:沃尔玛基于 BigQuery 做了 Data Agents 方面的尝试,以提升用户购买意愿。
- 代码 Agent:家居电商平台 Wayfair 利用 Gemini Code Assist,提升开发效率和开发满意度。
- 安全 Agent:巴西美妆集团 Grupo Boticario 借助 Gemini in Threat Intelligence 应对网络欺诈威胁,提升安全能力。
事实证明,围绕生成式 AI,Google Cloud 通过在从基础架构、大语言模型、平台、创新加速工具到 Agent 层面的创新,为您构建了云端新旅程。
而在 AI 新时代,下一个创新不在未来,应在今天。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。