【手撕 - 深度学习】TF Lite 魔改：添加自定义 op - 个人文章

作者：LogM

本文原载于 https://segmentfault.com/u/logm/articles ，不允许转载~

1. 前言

Tensorflow Lite 是 Tensorflow 移动端的版本。

有关于 Tensorflow 怎么添加自定义 op，网上有很多博客都讲到了，我就不介绍了。而 Tensorflow Lite 因为相对小众一些，所以网上关于添加自定义 op 的教程很少。

刚好最近因为项目需要，我在 Tensorflow Lite 中添加了几个自定义 op。我把我的思考过程以及修改步骤记录下来，方便有相同需求的同学参考。

我花了大篇幅记录思考过程和源码阅读过程，是希望给其他小伙伴一些启发，以后遇到类似的深度学习框架魔改的问题，可以不依赖网上教程。

不关心思考过程和源码阅读的小伙伴，可以直接跳到文章的最后，我把修改的步骤做了总结。

2. 源码来源

我使用源码是 Tensorflow v1.13.2

Tensorflow Lite 位于 tensorflow/lite 目录下。

3. 官方教程

官网也有关于 Tensorflow Lite 怎么添加自定义 op 的教程，详见官方地址。

官方教程把"怎么写自定义 op 的代码"讲得很清楚，遗憾的是没有详细说明怎么把这些新写的代码放入到工程中编译。

4. 进入正题

第1步，找到目标文件夹位置

首先我们要找到源码中放置自定义 op 的文件夹位置。有多种寻找的方式：

tensorflow 源码的目录结构非常清楚，有过类似框架阅读经验的同学应该马上能猜出位置；
官方教程告诉我们，自定义 op 的代码要实现 Prepare 和 Eval 这两个函数，那么我们使用 grep 命令查找有哪些代码文件中带有这两个函数。

最终，我们找到的位置是 tensorflow/lite/kernels。

找到目标文件夹位置以后，把新增代码放入该文件夹就可以了吗？显然，没有这么简单。有几个方面需要考虑：

代码逻辑层面，新增代码的逻辑怎么与源码的逻辑连接起来；
编译层面，新增代码怎么参与编译。

第2步，新增代码的逻辑怎么与源码的逻辑连接起来？

有过类似深度学习框架阅读经验的同学应该很快能想到，对于"添加自定义op"这个操作，就是个"op注册"的过程，所以马上想到去寻找带"register"字样的文件。

而没有深度学习框架阅读经验的同学也不用慌，官方教程告诉我们，自定义op在使用前需要调用 AddCustom 函数。那么很明显，这个函数就起到了将自定义op的逻辑与源码逻辑连接起来的任务。所以使用 grep 命令查找有哪些代码文件中带有这个函数。

两种方式殊途同归，找到关键文件 tensorflow/lite/kernels/register.cc。

// 文件：tensorflow/lite/kernels/register.cc
// 行数：22

namespace custom {

TfLiteRegistration* Register_AUDIO_SPECTROGRAM();
TfLiteRegistration* Register_LAYER_NORM_LSTM();
TfLiteRegistration* Register_MFCC();
TfLiteRegistration* Register_DETECTION_POSTPROCESS();
TfLiteRegistration* Register_RELU_1();

}

// 文件：tensorflow/lite/kernels/register.cc
// 行数：278

  // TODO(andrewharp, ahentz): Move these somewhere more appropriate so that
  // custom ops aren't always included by default.
  AddCustom("Mfcc", tflite::ops::custom::Register_MFCC());
  AddCustom("AudioSpectrogram",
            tflite::ops::custom::Register_AUDIO_SPECTROGRAM());
  AddCustom("LayerNormLstm", tflite::ops::custom::Register_LAYER_NORM_LSTM());
  AddCustom("Relu1", tflite::ops::custom::Register_RELU_1());
  AddCustom("TFLite_Detection_PostProcess",
            tflite::ops::custom::Register_DETECTION_POSTPROCESS());

嘿嘿嘿，我们发现官方源码中也放了5个自定义op，而且官方偷懒把自定义op与内置op的注册过程写在了一起，那么我们来看看官方是怎么写自定义op的吧，比如 Relu1 这个。

// 文件：tensorflow/lite/kernels/relu1.cc

#include "tensorflow/lite/context.h"
#include "tensorflow/lite/kernels/internal/tensor.h"
#include "tensorflow/lite/kernels/kernel_util.h"

namespace tflite {
namespace ops {
namespace custom {
namespace relu1 {

TfLiteStatus Prepare(TfLiteContext* context, TfLiteNode* node) {
  TF_LITE_ENSURE_EQ(context, NumInputs(node), 1);
  TF_LITE_ENSURE_EQ(context, NumOutputs(node), 1);
  const TfLiteTensor* input = GetInput(context, node, 0);
  TF_LITE_ENSURE_EQ(context, input->type, kTfLiteFloat32);
  TfLiteTensor* output = GetOutput(context, node, 0);
  output->type = input->type;
  return context->ResizeTensor(context, output,
                               TfLiteIntArrayCopy(input->dims));
}

// This is derived from lite/kernels/activations.cc.
TfLiteStatus Eval(TfLiteContext* context, TfLiteNode* node) {
  const TfLiteTensor* input = GetInput(context, node, 0);
  TfLiteTensor* output = GetOutput(context, node, 0);
  const int elements = NumElements(input);
  const float* in = input->data.f;
  const float* in_end = in + elements;
  float* out = output->data.f;
  for (; in < in_end; ++in, ++out) {
    *out = std::min(std::max(0.f, *in), 1.f);
  }
  return kTfLiteOk;
}

}  // namespace relu1

TfLiteRegistration* Register_RELU_1() {
  static TfLiteRegistration r = {/*init=*/nullptr, /*free=*/nullptr,
                                 relu1::Prepare, relu1::Eval};
  return &r;
}

}  // namespace custom
}  // namespace ops
}  // namespace tflite

可以看到，与官方给出的教程一样，关键点是实现 Prepare 和 Eval 这两个函数。我们自己在自定义op的代码时，可以把这个文件当做参考模板。

第3步，新增代码怎么参与编译？

这块需要一些 C++ 大工程开发的知识，Tensorflow 是用 Bazel 作工程编译的，所以关键点在目标文件夹下的 BUILD 文件。

而 BUILD 文件里面这么多的 library，我们的新代码应该编译到哪个 library 中呢？还记得官方留的自定义op "Relu1" 吗？我们来看看 "Relu1" 是编译到哪个 library。

// 文件：tensorflow/lite/kernels/BUILD
// 行数：278

cc_library(
    name = "builtin_op_kernels",
    srcs = [
        ...     // 这里有很多其他的源文件
        "mfcc.cc",
        "relu1.cc",
        ...     // 把新写的代码文件加到这边就可以了
    ],
    hdrs = [
    ],
    copts = tflite_copts() + tf_opts_nortti_if_android() + EXTRA_EIGEN_COPTS,
    visibility = ["//visibility:private"],
    deps = [
        ":activation_functor",
        ":eigen_support",
        ":kernel_util",
        ":lstm_eval",
        ":op_macros",
        ":padding",
        "//tensorflow/lite:framework",
        "//tensorflow/lite:string_util",
        "//tensorflow/lite/c:c_api_internal",
        "//tensorflow/lite/kernels:gemm_support",
        "//tensorflow/lite/kernels/internal:audio_utils",
        "//tensorflow/lite/kernels/internal:kernel_utils",
        "//tensorflow/lite/kernels/internal:optimized",
        "//tensorflow/lite/kernels/internal:optimized_base",
        "//tensorflow/lite/kernels/internal:quantization_util",
        "//tensorflow/lite/kernels/internal:reference_base",
        "//tensorflow/lite/kernels/internal:tensor",
        "//tensorflow/lite/kernels/internal:tensor_utils",
        "@farmhash_archive//:farmhash",
        "@flatbuffers",
    ],
)

嘿嘿嘿，官方可真会偷懒，自定义 op 和内置 op 一起编译到 builtin_op_kernels 库。所以，我们只要把新的代码文件添加到 srcs=[] 里，新的代码就能参与到编译过程中了。

5. 总结

Tensorflow Lite v1.13.2 中，官方偷了个懒，自定义 op 与内置 op 写在同一个位置，且都是编译到 builtin_op_kernels 库。

Tensorflow Lite 的自定义 op 添加方式如下：

参照官方教程以及 tensorflow/lite/kernels/relu1.cc 编写 op 代码；
将 op 代码放入 tensorflow/lite/kernels 文件夹下；
修改 tensorflow/lite/kernels/register.cc，完成新增 op 在代码逻辑上的"注册"；
修改 tensorflow/lite/kernels/BUILD，将新代码文件加入到 builtin_op_kernels 库的编译过程中；
参照官方教程重新编译整个项目。

【手撕 - 深度学习】TF Lite 魔改：添加自定义 op

1. 前言

2. 源码来源

3. 官方教程

4. 进入正题

第1步，找到目标文件夹位置

第2步，新增代码的逻辑怎么与源码的逻辑连接起来？

第3步，新增代码怎么参与编译？

5. 总结

LogM

引用和评论

【Linux】screen 常用命令

vLLM 实战教程汇总，从环境配置到大模型部署，中文文档追踪重磅更新

性能远超SAM系模型，苏黎世大学等开发通用3D血管分割基础模型

【vLLM 学习】基础教程

【Triton 教程】triton.heuristics

【TVM 教程】使用 TVMC Micro 执行微模型

登Nature子刊，俄罗斯研究团队基于机器学习实现万亿级质谱数据搜索，发现未知化学反应