7
头图

六大创新时刻解码 AI for what's Next? 一图读懂 Google Cloud Next 25 图文双版同步上线❤️

4 月 9 日 - 11 日,全球的目光再次聚焦拉斯维加斯,生成式 AI 在 Google Cloud Next 25 的聚光灯下,呈现出了新的叙事重点——从面向未来的单点技术突破转向广泛的当下价值实践。

现在,让我们一起回顾大会精华,抓住未来技术脉搏。


新速度💎

Google Cloud 正通过 AI 与云基础设施的深度融合,重新定义企业数字化转型的技术底座。其硬件架构与网络基建的协同创新,为企业向智能决策与实时响应加速演进注入了新动能。

Ironwood,面向推理时代的首款 Google TPU

Ironwood 的问世,代表着 AI 发展及其底层基础架构演进的重大转变。从为人们提供实时信息以供解读的响应式 AI (responsive AI)模型,转向能够主动生成洞察和解读的模型。这就是我们所说的「推理时代」(age of inference),在这个时代,AI agent 将主动检索和生成数据,以协同方式提供洞察与解答,而不仅仅是提供数据。
——Amin Vahdat
Google Cloud ML、系统和 Cloud AI 副总裁暨总经理

第七代 TPU Ironwood,是 Google Cloud 迄今为止性能最强、扩展性最高的自研 AI 加速器,专为规模化部署思考型、推理型 AI 模型而设计。

● 性能最强:与首款公开发布的 TPU 相比,Ironwood 的性能提升了 3,600 倍,能效也提高了近 30 倍。

● 扩展性最高:可扩展至 9,216 颗芯片,拥有 42.5 Exaflops 的峰值计算能力,是世界上目前最大的超级计算机的 24 倍以上。

● 高带宽内存 (HBM) 容量大幅提升:每颗芯片的 HBM 容量高达 192 GB,是 Trillium 的 6 倍。

● HBM 带宽显著提高:单芯片带宽达到 7.37 TB/s,是 Trillium 的 4.5 倍,确保在现代 AI 中,尤其是内存密集型工作负载下,能够高效运行。

● 增强的芯片间互连 (ICI) 带宽:双向带宽提升至 1.2 TBps,是 Trillium 的 1.5 倍。

Cloud WAN,以 Google 速度助力数字化转型

Cloud WAN 将彻底改变企业连接和保护其全球基础设施的方式。Cloud WAN 提供简便性、高性能、丰富的连接和安全服务选择,以及显著的成本节省,让您专注于云端及其他领域的创新和发展。
——Muninder Sambi
Google Cloud 云网络副总裁 

Cloud WAN 是一款跨云网络解决方案,与谷歌搜索、Gmail、YouTube 等谷歌自有基础服务共享同一基础设施网络,为企业用户提供高性能、低延迟的连接解决方案。

● 性能提升:相比公共互联网,Cloud WAN 将跨云网络的性能提高了 40%。

● 成本降低:与传统自建广域网方案相比,总拥有成本可节省高达 40%。

新力量💎

随着 Gemini 在企业级场景的应用不断深入,Vertex AI 的使用量仅过去一年就增长了 20 倍。这次,Google Cloud 不仅推出了注重性能与效益平衡的 Gemini 2.5 Flash,还带来了 Vertex AI 的全模态能力升级。

Gemini 2.5 Flash,性能与效率兼具

Gemini 2.5 模型现在具备思考能力,能够在响应之前进行推理,从而显著提升性能。这种透明的逐步推理对于企业信任和合规性至关重要。
——Jason GelmanGoogle
Cloud Vertex AI 产品管理总监
Tulsee Doshi
Google DeepMind 产品管理总监

Gemini 2.5 Flash 是专为低延迟和成本效益而优化的主力模型,具备动态可控的推理能力,能够根据查询的复杂程度调整响应时间,帮助用户在性能和预算之间取得平衡。

● 开发者可以启用或禁用“推理”功能,从而在质量、成本和延迟之间找到平衡

● 通过调整推理量(最多可使用 24,576 个 token),可以在提高模型准确度的同时,保持较低的成本

● 事实上,Gemini 2.5 Flash 在 LMArena 的难题中表现突出,仅次于 Gemini 2.5 Pro。

VertexAI 持续深入企业级场景

除了 Gemini,我们还拥有一套令人难以置信的生成媒体模型,这些模型正在将效率、创造力和客户参与度提升到新的水平。
——Thomas Kurian
Google Cloud 首席执行官

随着文本转音乐模型 Lyria 的推出,Vertex AI 成为目前唯一一个拥有涵盖所有模态(视频、图像、语音和音乐)的生成媒体模型的平台。

● 新推出的 Lyria 是业界首款企业级文本转音乐模型,能够制作各种风格的高保真音频,用于营销活动、产品发布、沉浸式店内体验,或其他数字内容创作配乐。

● Veo 2 新增包括智能擦除、智能扩图和智能补帧在内的高级编辑功能,以及镜头控制能力,可满足更为复杂的视频制作需求。

● Chirp 3 新增了仅需 10 秒音频即可创建自定义语音的功能,并改进了多人说话的转录功能,显著提升会议纪要、播客分析和多方通话录音等应用的转录清晰度和易用性。

● Imagen 3 的修复功能得到了重大改进,可重建图像中确实或损坏的部分,显著提升了对象移除的质量,带来更自然流畅的编辑体验。

新范式💎

AI 正从单一用途模型向智能自主的多智能体系统迈进。Google Cloud 推出了包括 Agent2Agent (A2A) 协议和开源框架 Agent Development Kit (ADK) 在内的等多项更新,以期加速产业级智能协作生态的构建。

Agent2Agent (A2A),业界首个标准智能体交互协议

无论采用何种底层技术,AI 智能体都可以无缝协作,实现复杂的企业工作流程自动化,并推动前所未有的效率和创新水平。
——Rao Surapaneni
Google Cloud 业务应用平台副总裁兼总经理
Miku Jha
Google Cloud AI/ML 合作伙伴工程总监
Michael VakocGoogle
Cloud 产品经理
Todd Segal
Google Cloud 业务应用平台首席工程师A

Agent2Agent (A2A) 是基于 HTTP、SSE 等通用标准构建的协议,支持企业级验证和授权,旨在帮助企业突破供应商与框架限制,让智能体能够跨平台安全地通信、交换信息并协调行动。

● 能力发现: 允许使用 JSON 格式的“Agent Card”来描述自身功能,从而允许 Client agent 识别能够执行任务的最佳 Agent 并利用 A2A 与 Remote Agent 进行通信。

●  任务管理:协议定义了“任务”对象及其生命周期,支持短时和长时任务,并确保多智能体在任务进展中保持同步,可靠地传递任务的最终产出物。

● 协作通信:A2A 定义了智能体之间发送结构化消息的规范,用以传递必要的上下文信息、中间步骤的回复、最终的“Artifacts”以及来自用户的具体指令。

● 体验协商:支持智能体之间就最适合向用户或调用方呈现信息的方式进行协商。

Agent Development Kit (ADK),更轻松地构建下一代 AI Agent

借助 ADK,您可以比以往更轻松地开始使用由 Gemini 模型和 Google AI 工具驱动的智能体。
——Stephanie Wong
Google Cloud 开发者技能与社区负责人

● 灵活性:ADK 不仅能与各种工具灵活协同,还针对与 Google Cloud 生态系统的无缝集成进行了优化,特别是与 Gemini 模型和 Vertex AI 的无缝集成。

● 多模态:借助 ADK 独特的双相音频和视频流式传输功能,只需几行代码即可创建自然的交互,彻底改变协作方式。

从硬件基础设施到智能体生态,Google Cloud 在会上带来了超过 200 项新内容。这些已被验证的解决方案和面向未来的价值创新,都是 Google Cloud 对“AI for what's Next?”的回应——提供更稳定的基建、更强大的模型、更丰富的平台,从而让 AI 使人人受益。


SegmentFault思否
14.5k 声望171.9k 粉丝

SegmentFault 社区管理媛 - 思否小姐姐