英伟达宣布2027年和2028年推出“Rubin Ultra”和“Feynman”AI芯片

Nvidia GTC 2025 发布会总结

在2025年3月19日于加州圣何塞举行的Nvidia GTC 2025大会上,CEO Jensen Huang宣布了多款即将发布的新AI加速GPU,并透露了此前已公布芯片的更多细节。以下是发布会的主要内容:

Vera Rubin GPU

  • 发布时间:2026年下半年
  • 命名来源:以著名天文学家Vera Rubin命名
  • 核心配置:集成两个GPU,单个芯片提供50 petaflops的FP4推理性能
  • 内存:288GB
  • CPU:配备定制的Nvidia Vera CPU,含88个ARM核心和176线程
  • 连接:通过1.8 TB/s的NVLink接口连接GPU
  • 系统性能:在NVL144机架配置下,系统提供3.6 exaflops的FP4推理性能,是Blackwell Ultra的3.3倍

Rubin Ultra GPU

  • 发布时间:2027年下半年
  • 核心配置:单个GPU包含四个掩模尺寸的芯片,提供100 petaflops的FP4精度
  • 内存:每个GPU配备1TB HBM4e内存,完整机架含365TB快速内存
  • 系统性能:在NVL576机架配置下,系统提供15 exaflops的FP4推理性能和5 exaflops的FP8训练性能,是Rubin NVL144的4倍

Blackwell Ultra B300 GPU

  • 发布时间:2025年下半年
  • 核心配置:集成两个GPU,单个芯片提供15 petaflops的密集FP4计算性能
  • 内存:每个B300 GPU配备288GB HBM3e内存,高于Blackwell B200的192GB
  • 系统性能:在NVL72机架配置下,系统提供1.1 exaflops的密集FP4推理性能,是当前Blackwell B200配置的1.5倍

下一代架构Feynman

  • 命名来源:以美国理论物理学家Richard Feynman命名
  • CPU:将使用Vera CPU而非预期的Richard CPU
  • 发布时间:预计2028年
  • 细节:目前尚未公布更多设计或性能信息

AI未来愿景

  • 数据中心:Huang将数据中心称为“AI工厂”,生产AI模型处理的数据单位(tokens)而非物理对象
  • 物理AI:他展望了未来“物理AI”将驱动人形机器人执行类似人类的劳动
  • 数字代理:预计Nvidia芯片将支持“100亿个数字代理”为人类提供帮助
  • 工程师辅助:到2025年底,Nvidia所有工程师将获得AI模型的辅助

修正说明

  • Vera Rubin内存:文章更新了Vera Rubin芯片的内存规格,此前提到的“数十TB”为整个集群的内存,而芯片本身配备288GB内存。

此次发布会展示了Nvidia在AI硬件领域的持续创新,并描绘了AI技术在未来社会中的广泛应用前景。

阅读 11 (UV 11)
0 条评论