【TVM 教程】用 TEDD 进行可视化

Apache TVM 是一个端到端的深度学习编译框架，适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 → https://tvm.hyper.ai/

本文介绍使用 TEDD（Tensor Expression Debug Display）对张量表达式进行可视化。

张量表达式使用原语进行调度，单个原语容易理解，但组合在一起时，就会变得复杂。在张量表达式中引入了调度原语的操作模型。

不同调度原语之间的交互，
调度原语对最终代码生成的影响。

操作模型基于数据流图、调度树和 IterVar 关系图。调度原语在这些计算图上进行操作。

TEDD 从给定的 schedule 中呈现这三个计算图，本教程演示了如何用 TEDD，以及如何解释渲染的计算图。

import tvm
from tvm import te
from tvm import topi
from tvm.contrib import tedd

使用 Bias 和 ReLU 定义和调度卷积

用 Bias 和 ReLU 为卷积构建一个张量表达式示例，首先连接 conv2d、add 和 relu TOPIs，然后创建一个 TOPI 通用 schedule。

batch = 1
in_channel = 256
in_size = 32
num_filter = 256
kernel = 3
stride = 1
padding = "SAME"
dilation = 1

A = te.placeholder((in_size, in_size, in_channel, batch), name="A")
W = te.placeholder((kernel, kernel, in_channel, num_filter), name="W")
B = te.placeholder((1, num_filter, 1), name="bias")

with tvm.target.Target("llvm"):
    t_conv = topi.nn.conv2d_hwcn(A, W, stride, padding, dilation)
    t_bias = topi.add(t_conv, B)
    t_relu = topi.nn.relu(t_bias)
    s = topi.generic.schedule_conv2d_hwcn([t_relu])

使用 TEDD 渲染计算图

通过渲染计算图来查看计算及其调度方式。若在 Jupyter Notebook 中运行本教程，则可以用以下注释行来渲染 SVG 图形，让它直接在 Notebook 中显示。

tedd.viz_dataflow_graph(s, dot_file_path="/tmp/dfg.dot")
# tedd.viz_dataflow_graph(s, show_svg = True)

在这里插入图片描述
第一个是数据流图。每个节点代表一个阶段，中间是名称和内存范围，两边是输入/输出信息。图中的边显示节点的依赖关系。

tedd.viz_schedule_tree(s, dot_file_path="/tmp/scheduletree.dot")
# tedd.viz_schedule_tree(s, show_svg = True)

上面渲染了调度树图。注意范围不可用的警告，它表明要调用 normalize() 来推断范围信息。跳过检查第一个调度树，推荐通过比较 normalize() 之前和之后的计算图来了解其影响。

s = s.normalize()
tedd.viz_schedule_tree(s, dot_file_path="/tmp/scheduletree2.dot")
# tedd.viz_schedule_tree(s, show_svg = True)

在这里插入图片描述
仔细看第二个调度树，ROOT 下的每一个 block 代表一个阶段。阶段名称显示在顶行，计算显示在底行。中间行是 IterVars，外部越高，内部越低。

IterVar 行包含其索引、名称、类型和其他可选信息。以 W.shared 阶段为例，第一行是名称「W.shared」和内存范围「Shared」。它的计算是 W(ax0, ax1, ax2, ax3)。最外层循环 IterVar 是 ax0.ax1.fused.ax2.fused.ax3.fused.outer，以 kDataPar 的 0 为索引，绑定到 threadIdx.y，范围（min=0，ext=8）。

还可以用索引框的颜色来判断 IterVar 类型，如图所示。

如果一个阶段在任何其他阶段都没有计算，则它有直接到根节点的边；否则，它有一条边指向它所附加的 IterVar，例如 W.shared 在中间计算阶段附加到 rx.outer。

tedd.viz_itervar_relationship_graph(s, dot_file_path="/tmp/itervar.dot")
# tedd.viz_itervar_relationship_graph(s, show_svg = True)

在这里插入图片描述
最后一个是 IterVar 关系图。每个子图代表一个阶段，包含 IterVar 节点和转换节点。

例如，W.shared 有三个拆分节点和三个融合节点。其余的是与调度树中的 IterVar 行格式相同的 IterVar 节点。 Root IterVars 是那些不受任何变换节点驱动的，例如 ax0；叶节点 IterVars 不驱动任何转换节点，并且具有非负索引，例如索引为 0 的 ax0.ax1.fused.ax2.fused.ax3.fused.outer。

总结

本教程演示 TEDD 的用法。用一个 TOPI 构建的示例来显示底层的 schedule，可在任何调度原语之前和之后用它来检查其效果。

下载 Python 源代码：tedd.py

下载 Jupyter Notebook：tedd.ipynb

【TVM 教程】用 TEDD 进行可视化

使用 Bias 和 ReLU 定义和调度卷积

使用 TEDD 渲染计算图

总结

超神经HyperAI

引用和评论

多主体驱动生成能力达 SOTA，字节 UNO 模型可处理多种图像生成任务

🔥全程不用写代码，我用 AI 程序员写了一个飞机大战

从 DeepSeek 看25年前端的一个小趋势

人工智能与机器学习入门：基尼系数（Gini Index）和基于熵（Entropy）

DeepSeek(私有化)+IDEA+Dify+微信搭建AI助手保姆级教程

Open WebUI：开源AI交互平台的全面解析

大模型中的Token究竟是什么？从原理到作用深度解析

【TVM 教程】用 TEDD 进行可视化

使用 Bias 和 ReLU 定义和调度卷积

使用 TEDD 渲染计算图

总结

超神经HyperAI

引用和评论

多主体驱动生成能力达 SOTA，字节 UNO 模型可处理多种图像生成任务

🔥全程不用写代码，我用 AI 程序员写了一个飞机大战

从 DeepSeek 看25年前端的一个小趋势

人工智能与机器学习入门：基尼系数（Gini Index）和基于熵（Entropy）

DeepSeek(私有化)+IDEA+Dify+微信 搭建AI助手保姆级教程

Open WebUI：开源AI交互平台的全面解析

大模型中的Token究竟是什么？从原理到作用深度解析

DeepSeek(私有化)+IDEA+Dify+微信搭建AI助手保姆级教程