一个性能调查挑战 —— 马修·高迪特

主要观点:作者喜欢 matklad 的[性能可视化挑战],并提及存在技能差距或研究问题即如何识别有影响力但分散的问题。以优化 Speedometer 3 中的函数为例,同事 Iain Ireland 起初通过生成的汇编难以确定问题,一个月后找到一个影响很大的补丁,去除了一个特定优化,使某些基准提升 6 - 8%,推测是在某些 x86 硬件上该拆分写破坏了存储转发从而削弱性能,有假设后通过 perf 和性能计数器显示补丁减少了失败转发量,而疑问是如何在不幸运碰到的情况下找到这类问题,作者有 Brendan Gregg 的《System’s Performance》未读,好奇他人是否有好方法,Iain 补充说明认为已理解问题是加载 - 存储冲突问题,且指出之前未做的关键部分就是存储包含加载的所有字节。
关键信息:matklad 的挑战链接、优化 Speedometer 3 的 bug 链接、Iain 的补丁链接、相关理论链接等。
重要细节:同事 Iain Ireland 最初的探索过程、补丁带来的性能提升效果、后续对问题的理解及相关引用等。

阅读 10
0 条评论