英伟达宣布2027年和2028年推出“Rubin Ultra”和“Feynman”AI芯片 - SegmentFault 思否

英伟达宣布2027年和2028年推出“Rubin Ultra”和“Feynman”AI芯片

发布于 3 月 19 日

Nvidia GTC 2025 发布会总结

在2025年3月19日于加州圣何塞举行的Nvidia GTC 2025大会上，CEO Jensen Huang宣布了多款即将发布的新AI加速GPU，并透露了此前已公布芯片的更多细节。以下是发布会的主要内容：

Vera Rubin GPU

发布时间：2026年下半年
命名来源：以著名天文学家Vera Rubin命名
核心配置：集成两个GPU，单个芯片提供50 petaflops的FP4推理性能
内存：288GB
CPU：配备定制的Nvidia Vera CPU，含88个ARM核心和176线程
连接：通过1.8 TB/s的NVLink接口连接GPU
系统性能：在NVL144机架配置下，系统提供3.6 exaflops的FP4推理性能，是Blackwell Ultra的3.3倍

Rubin Ultra GPU

发布时间：2027年下半年
核心配置：单个GPU包含四个掩模尺寸的芯片，提供100 petaflops的FP4精度
内存：每个GPU配备1TB HBM4e内存，完整机架含365TB快速内存
系统性能：在NVL576机架配置下，系统提供15 exaflops的FP4推理性能和5 exaflops的FP8训练性能，是Rubin NVL144的4倍

Blackwell Ultra B300 GPU

发布时间：2025年下半年
核心配置：集成两个GPU，单个芯片提供15 petaflops的密集FP4计算性能
内存：每个B300 GPU配备288GB HBM3e内存，高于Blackwell B200的192GB
系统性能：在NVL72机架配置下，系统提供1.1 exaflops的密集FP4推理性能，是当前Blackwell B200配置的1.5倍

下一代架构Feynman

命名来源：以美国理论物理学家Richard Feynman命名
CPU：将使用Vera CPU而非预期的Richard CPU
发布时间：预计2028年
细节：目前尚未公布更多设计或性能信息

AI未来愿景

数据中心：Huang将数据中心称为“AI工厂”，生产AI模型处理的数据单位（tokens）而非物理对象
物理AI：他展望了未来“物理AI”将驱动人形机器人执行类似人类的劳动
数字代理：预计Nvidia芯片将支持“100亿个数字代理”为人类提供帮助
工程师辅助：到2025年底，Nvidia所有工程师将获得AI模型的辅助

修正说明

Vera Rubin内存：文章更新了Vera Rubin芯片的内存规格，此前提到的“数十TB”为整个集群的内存，而芯片本身配备288GB内存。

此次发布会展示了Nvidia在AI硬件领域的持续创新，并描绘了AI技术在未来社会中的广泛应用前景。

Nvidia announces “Rubin Ultra” and “Feynman” AI chips for 2027 and 2028

https://arstechnica.com/ai/2025/03/nvidia-announces-rubin-ultra-and-feynman-ai-chips-for-2027-and-2028/

阅读 192

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。