电子图中有什么？ - SegmentFault 思否

主要观点：编译器与程序表示有关，通过不同内部语言转换优化程序。传统的编译器优化方式如遍历指令进行替换，还有更高效的并查集（union-find）方式，能快速进行就地 IR 重写，但枚举等价类较慢。通过逐步添加“匹配”和“提取”功能，从并查集发展到 e-graph，e-graph 可更广泛搜索最优程序，但提取过程可能很慢，且成本函数通常由库用户提供。不同编译器如 Cranelift 对 e-graph 有不同实现和变体。

关键信息：

编译器以一种语言接收程序，通过内部语言转换后以另一种语言输出程序。
传统编译器优化需遍历指令替换，如对v2 = v0 * v1可通过遍历替换所有v2的使用。
并查集 API 有union和find，可标记 IR 节点为“指向”另一个节点，进行快速重写，如instr->make_equal_to(new LeftShift(instr->Operand(0), new Const(3)))。
并查集的局限性在于不能枚举集合元素、每个集合只有一个代表元素且只关心集合代表。
优化过程中，看似局部的重写可能有全局影响，如强度缩减可能丢失信息。
可通过discover_eclasses函数枚举并查集结构隐含构建的等价类。
匹配操作可通过循环等价类来查找特定模式，如(a * b) / b。
e-graph 的最终部分是extract函数，通过遍历笛卡尔积找到程序的最低成本或最优版本，但通常很慢。
许多 e-graph 实现建议库用户提供声明性语法重写规则。

重要细节：

不同编译器对 e-graph 有不同变体，如 Cranelift 的 aegraph 有其特点。
在并查集优化中，路径压缩是可添加的优化特征，不改变 API。
文中给出了 Phil 的简洁并查集实现代码及注释。
提到了 egg 和 egglog 相关工作，以及将 SQL 移植到 Python 的学习经历。
感谢 Kartik Agaram、Max Willsey 和 Chris Fallin 对文章的审核。