主要观点:大型机在当今仍发挥重要作用,IBM 的 Telum II 是其最新的大型机处理器,设计独特,核心数少但频率高且缓存大,还包含 DPU 和板载 AI 加速器,基于三星 5nm 工艺节点。
关键信息:
- Telum II 有十个 36MB 的 L2 缓存,L2 延迟为 3.6ns,容量大。
- 为减少内存访问延迟,采用虚拟 L3 和 L4 策略,通过降低缓存数据重复,利用 L2 容量创建虚拟 L3 缓存,还可控制虚拟 L3 使用的 L2 容量。
- 多个 Telum II 处理器可连接形成大型共享内存系统,创建 2.8GB 虚拟 L4。
- IBM 大型机芯片策略注重单线程性能,核心数从 Z15 的 12 个减少到 Telum 和 Telum II 的 8 个,缓存容量大。
重要细节: - AMD 的 Zen 3 桌面和服务器 CPU 的 L3 缓存通常为 32MB,Qualcomm 的 Oryon 核心 L2 缓存为 12MB 且延迟为 5.29ns,而 Telum II 的 L2 延迟更短。
- IBM 处理虚拟 L3 跨 L2 切片访问的方式是可能检查所有 L2 切片,虽可能增加标签比较开销但 L2 未命中率低。
- IBM 大型机 CPU 组织成 CPC 抽屉,类似机架式服务器,先前设计有抽屉范围的 L4,Telum II 可能沿用此方式创建虚拟 L4。
- 对比 AMD 高端 CPU,IBM 大型机芯片使用快速跨芯片互连,Zen 5 CCD 的 Infinity Fabric 链路读写带宽较低。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。