‘关于信任信任的反思’，但这次完全是偶然的

发布于 2025-07-23

主要观点：编译器复杂，以 LLVM 为例，现代优化编译器的部分复杂性是 Conway 定律和几十年代码库的必然结果，仍存在大量固有混乱。每台计算机都是编译器模糊测试器，通过大量测试确保生产编译器的可靠性，但仍有漏洞。介绍了一个影响不大的误编译案例，通过一系列步骤重现和分析该 bug，涉及 Clang 编译过程、循环向量器、SelectionDAG 等，最终确定是 SelectionDAG::getVectorShuffle 函数的问题，经过多种尝试和调试找到根源，强调编译器工程师不必深入了解细节，只需知道正确和错误的 IR 以及修复和添加测试用例即可。

关键信息：

现代编译器复杂，如 LLVM 后端像 200 个编译器在 trench coat 里。
每台计算机参与编译器测试，生产编译器在特定条件下较可靠但仍有漏洞。
一个 Clang 误编译案例，通过特定步骤重现，涉及 stage1/stage2 编译、不同架构测试等。
分析发现是 SelectionDAG::getVectorShuffle 函数出问题，涉及向量操作、循环等。
编译器 bug 根因链条很深，涉及多个 passes 相互作用。

重要细节：

介绍了 Clang 编译的不同阶段和相关命令，如 stage1/stage2 构建的 CMake 命令。
详细解释了 SelectionDAG 的概念、作用、各个阶段的变换（如 legalization、指令选择等）及相关可视化工具。
展示了误编译前后的 IR 差异，包括具体的函数变化和数据丢失等。
描述了通过多种方式尝试解决问题，如在不同架构上测试、添加调试选项等。
提及一些相关工具和资源，如 yarpgen、alive2、Csmith 等。

阅读 29