随着科技的不断进步,数据中心作为数字经济时代的核心基础设施,正经历着前所未有的变革。近两个月以来,Intel和AMD两大芯片巨头纷纷发布了自家的新一代处理器,分别是代号为“Granite
Rapids”&“Sierra Forest”组合的英特尔 ®至强® 6处理器和代号为“Turin”的AMD EPYC
5代处理器。这些新品在技术参数、功能特性及性能表现上均有显著提升,为数据中心的产品迭代注入了新的活力,同时也深刻影响着算力产业的未来发展。一、英特尔 ®至强® 6处理器随着AMD的强势追赶,英特尔®至强®处理器在迭代中加快了步伐,®至强® 6处理器于近期发布,各服务器厂商的新品也将很快面市。

®至强®6由两个系列组成,对应为P(性能)核与E(能效)核,并且还分为了67xx和69xx两个系列。目前已发布的是6700E这7个型号的SKU与5个6900P型号的SKU,其他6700P与6900E预计将会在2025Q1发布上市。

1.技术参数®至强®6处理器分大小核设计(性能核&能效核)Ø 性能核(P-标准大核):性能核的单核性能高,拥有比其他通用 CPU 更好的 AI 性能,内存吞吐量高。每路多达128个内核,三级缓存高达504 MB,能够以较低的时延从三级缓存访问大量数据。Ø 能效核(E-小核)能效核实现了更高的内核密度,拥有更高的每瓦性能,这一特点使得它在电力、空间和散热受限的环境下可以作为理想选择。6900E每路可多达288个内核,三级缓存高达216 MB,能够以较低的时延从三级缓存访问大量数据。(1)以下为已发布的5个6900P型号SKU相关参数:

(2)以下为已发布的7个6700E型号SKU相关参数:

2.P核与E核间的区别P核与E核处理器使用相同的I/O芯片,但它们的一些功能及应用场景存在差异。P-core(性能核)采用超线程内核,内置矩阵引擎可加速计算密集型人工智能、高性能计算和数据服务工作负载,而 E-core(能效核)则省去了矩阵引擎,以支持更高的单线程内核密度。下图是两者各参数的直观对比。

采用
P-core(性能核)的英特尔® 至强® 6 处理器,每个插槽可灵活扩展至 128 个内核、12 个内存通道和 96 个 PCIe
通道,其多路合并阵列 (MRDIMM) 可提供高达每秒 8,800 兆 (MT/s)
的传输速度,内置加速器为目标工作负载提供额外的提升,实现更高的性能和效率。采用
E-core(能效核)的英特尔®至强® 6 处理器拥有多达 288
个内核,可为高吞吐量工作负载提供高效性能,因此是功耗、空间和散热有限的情况下的较好选择。E-core(能效核)具有高内存带宽和丰富的
I/O,提供了 12 个 DDR5 通道、多达 64 个 CXL 2.0 通道和多达 96 个PCIe 5.0 通道。由于P核与E核存在较大的参数差异,因此在使用场景方面也有很大的不同。P-core(性能核)主要应用于人工智能、高性能计算以及存储数据服务等场景,而E-core(能效核)则主要应用于云计算、网络等对高密度和横向扩展的工作场景。

二、AMD EPYC 5代处理器在今年的Advancing
AI 2024大会上,AMD正式发布了第五代EPYC的第一波处理器产品,EPYC 9005系列,代号Turin。它基于全新的Zen 5、Zen
5c架构,规格、性能再次实现较大飞跃。目前AMD
EPYC企业级处理器在发展路径上也在稳步向前推进,并在服务器市场上呈现一个追赶的态势,正在逐步攻占Intel的市场份额,根据第三方机构统计显示最新的市场份额已经达到了34%,AMD的上下游生态日渐繁荣。

1.技术参数Zen
5、Zen 5c架构都被划分在了EPYC
9005系列之内,在核心数、内存与PCIe连接上有所不同。首先,CCD核心制造工艺从5/6nm升级到了最新的3/4nm,IOD部分则是6nm,总晶体管多达1500亿个,因此具备了更高的集成度,以及更高的频率。

l Zen 5架构,CCD采用4nm工艺,单芯片数量从12个增至16个(继续搭配一个IOD),每个CCD内还是8核心,因此总数从96核心192线程增至128核心256线程。l Zen 5c架构,CCD采用3nm工艺,单芯片数量从8个增至12个(也搭配一个IOD),每个CCD内仍然是16核心,总数多达空前的192核心384线程。在架构方面Zen 5、Zen 5c是完全一致的,IPC性能、ISA指令集毫无二致,比如都支持完整的AVX-512指令,只是后者的三级缓存少一些、频率低一些而已,操作系统和应用软件都不需要特殊适配。这与Intel性能核、能效核的异构架构完全是两条路线。另外,核心数量大增的同时,EPYC 9005系列的最高睿频首次做到了5GHz,相比于四代EPYC的最高值增加了足足900MHz。当然,在功耗方面不可避免地增加了,最高可以达到500W。

在内存方面,最高还是12个通道,频率从DDR5-4800提高到6400,支持ECC,单路6TB容量,仍为128个PCIe 5.0/CXL 2.0通道。EPYC 9005全系列共有27款SKU,名称中的“5”代表的是Zen5架构,并且有两个版本可供选择:22款具有Zen5经典核心的128核版本和5款具有更密集的Zen5c的192核版本。

2.9005系列CPU特性Ø 动态封装后修复(PPR):这一代新引入了“动态封装后修复”功能,适用于x8/x4 ECC RDIMM,具体情况暂未公布,据网上资料了解此功能可以及时修复内存物理错误甚至缺陷,大幅提升稳定性。Ø CXL 2.0:I/O方面,PCIe 5.0通道最多还是160条,新增了PCIe链接加密功能,并且从CXL 1.1+升级到CXL 2.0。Ø EPYC 9005系列依然采用SP5封装接口,无缝兼容EPYC 9004系列。Intel至强6则有LGA4710、LGA7529两种新接口。Ø 安全性方面: 新增可信赖I/O(Trusted I/O)。

三、EPYC 5代与至强6处理器规格对比l 核心数:EPYC 9005 Zen 5最多128核心256线程,与至强6900P持平。Zen 5c最多是192核心384线程,远远领先至强6700E的144核心144线程。l 频率EPYC 9005最高达到了空前的5.0GHz,Zen 5c最高也有3.7GHz。至强6最高频率SKU没有迈过4GHz的门槛,6900P最高统一都是3.9GHz,6700E系列更是只有3.2GHz。l 三级缓存EPYC 9005 Zen 5、Zen 5c最多分别做到了512MB、384MB,平均每个核心分别4MB、2MB。至强6900P最多504MB,只低了一点点;至强6700E则是最多108MB,远低于竞争对手,平均每个核心不到1MB。l DDR5内存EPYC 9005系列全部统一支持12通道DDR5-6000,最低端的产品也一样。至强6900P系列也是12通道,频率更高一些DDR5-6400,还支持新型MRDIMM内存,频率高达8800MHz——这几乎是至强6唯一的优势了。至强6700E系列只有8个内存通道,而且只有部分型号保留DDR5-6400的频率,还有一部分降级为DDR5-5600。l PCIe 5.0通道EPYC 9005系列都是128条PCIe 5.0通道,和上一代相同。至强6900P系列只有96条,至强6700E系列进一步减少到88条。l 热设计功耗两者最高都达到了500W,尤其都是在128核心的SKU上的TDP功耗。不过,Zen 5c 192核心时也有500W,至强6700E 144核心时则是330W,平均到每个核心后者更低一些为2.3W,前者是2.6W。l 平台扩展性EPYC 9005系列延续了上一代的SP5封装接口,客户可以无缝升级,而且按照AMD的做法,这对国内服务器厂家无疑是个好消息。这一接口还会延续下去,可能要等到支持DDR6内存的时候才会改变。至强6系列不但用了新接口,还分为两种。至强6900P系列是LGA7529,至强6700E系列是LGA4710,不仅上一代无法升级,大小核之间也无法通用。l 其他方面EPYC 9005系列全部支持AVX-512指令集,这本来是Intel的独门绝技,但异构大小核的设计让它消失了,至强6也没有。EPYC 9005系列全部支持多线程,至强6900P也有,至强6700E不支持超线程。至强6内置了一系列的AI加速器,可以让某些特定负载大大加速,EPYC 9005系列则没有。四、性能评测据权威Phoronix网站对EPYC 9005系列与至强6主流处理器进行的140个数据中心测试项目的全方位评测,可以看到EPYC 9005系列对比至强6呈现出比较明显的优势。对比两者的旗舰SKU产品,EPYC 9755面对MRDIMM-8000高频内存加持的至强6980P,双路、单路优势分别高达40.0%、18.4%,如果将后者换成普通的DDR5-6400,领先幅度更是能进一步提升到41.7%、19.3%。

5代与至强6处理器的发布不仅标志着芯片巨头们在技术上的持续创新与突破,也深刻影响着算力产业的未来发展。随着算力需求的不断增长和技术的不断进步,我们有理由相信,未来的算力市场将更加多元化、智能化和高效化。思腾合力深耕人工智能领域,致力于为客户提供一栈式的算力解决方案,共推动全球数字经济的繁荣发展。


意犹未尽ゝ
1 声望0 粉丝