主要观点:2024 年底 Harold Aptroot 称 Alder Lake 上的shlx
指令是“中等延迟”(3 周期),引发作者对低级别性能分析的关注并进行研究。Alder Lake 是英特尔酷睿处理器第 12 代,具有混合架构,shlx
是 BMI2 指令集的左移指令,与SHL
不同且不影响flags
寄存器,通常其他 CPU 上该指令为 1 周期,仅 Alder Lake 的性能核心有此问题,uops.info 称其延迟为 3 周期,而 Intel 和 InstLatX64 称其为 1 周期,作者通过自己编写基准测试来探究差异。
关键信息:
shlx
指令特点及与SHL
的区别。- Alder Lake 的混合架构及性能核心与效率核心的差异。
- 不同初始化
rcx
方式对shlx
指令性能的影响。
重要细节: - 作者的基准测试代码及运行结果,如不同
rcx
初始化方式下的指令周期数。 - 提到的相关链接如Twitter等用于获取更多信息。
- 对
shlx
指令延迟差异原因暂未找到好的解释,若有发现会更新页面。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。