这是一篇关于 AMD Zen 5 的采访转录,主要内容如下:
- 介绍与背景:采访者 George Cozma 与 AMD 的 Zen 之父 Mike Clark 展开对话,此次采访是关于 AMD Zen 5 技术日的内容,若读者喜欢此类内容可留言,也可提出改进建议,转录内容经过编辑以提高可读性和简洁性。
- 前端部分:分支预测器可同时处理两个已取分支和两个提前分支,在某些情况下能做到,每个周期最多处理两个分支;解码器为 2 乘 4 宽,从双端口指令获取中获取指令并独立解码;微操作缓存为 2 乘 6 宽,最佳情况下可同时访问两个地址并取出 6 条指令,最多每秒从缓存中取出 12 条指令。
- 单线程性能:单线程能利用所有前端资源,包括两个解码集群和双端口 OP 缓存,设计理念是在单线程模式下提供良好的性能,无需为单线程模式缩小资源。
- SMT 线程相关:在双线程模式下,每个线程有一个 4 宽解码器,缓存和 TLB 是竞争共享的,退休队列、重排序缓冲区等是静态分区的,这样能避免一个线程占用所有资源影响另一个线程。
- 调度器相关:整数单元合并了 ALU 和 AGU 的调度器,以提高效率,避免在多周期操作时出现虚假延迟;向量单元添加了一个调度器,因为整数单元的操作相对简单,而浮点单元需要调度多周期操作,增加调度器可提高浮点操作的调度能力。
- 寄存器与存储单元:向量单元的寄存器数量增加到 384,整数单元仅增加 16 个,这是因为寄存器文件是设计中的关键路径,浮点单元操作的延迟较长,对寄存器的使用更有规律性。在存储方面,数据缓存每个周期可处理 4 个内存操作,浮点单元最多同时处理 2 个 128 位或 256 位存储,每个周期只能处理 1 个 512 位存储。
- 结尾与感谢:George Cozma 询问 Mike Clark 最喜欢的奶酪类型,Mike Clark 回答是切达干酪,采访结束,George Cozma 感谢 Mike Clark,同时表示将在 chipsandcheese.com 发布关于 Zen 5 的文章,欢迎读者订阅和支持。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。