这个库厉害了，自动补全 Python 代码，节省 50% 敲码时间

摘要：介绍一个优秀代码自动补全工具库。

近日，Reddit 上的一篇帖子引起了网友的热议。帖子作者「mlvpj」称：

「我们使用深度学习完成了一个简单的项目，可以自动进行 Python 代码补全。」

根据介绍，该项目基于 LSTM 模型，训练后，负责对代码的缺失部分进行补全。评价模型的方法是判断节省了多少的按键信息——即模型给出长度为 L 的代码建议，如果和真实的代码匹配，则节省 L - 1 个键入操作。实验结果说明，大约可以节省 30%-50% 的时间键入成本。

作者在帖子中表示，他们接下来会尝试不同的架构，并提高推断的表现。而现在的模型推断很慢，不能实际使用。作者已在 GitHub 开源了项目代码：

在项目开发中，优秀的代码自动补全工具可以提升工作效率。然而，近来的 IDE 基本都使用搜索方法进行补全，在一些场景下效果不佳。近日，有开源项目用深度学习模型进行代码补全，显示出非常有潜力的效果。

我们知道很多 IDE 提供自动补全功能，这款工具又有什么区别呢？

和 IDE 的自动补全有什么区别

该项目对 Python 代码的自动补全与传统 IDE（如 PyCharm）等不同。IDE 补全基于检索方法，需要从已有代码中进行搜索。

以 PyCharm 中的基本补全（Basic Completion）方法为例。基本补全可帮助补全可见区域的类、方法、关键词代码。使用时，PyCharm 会分析补全使用情况，并提供当前位置可能的选择。如果是对空间、参数或变量声明进行补全，则 PyCharm 会基于类别提供一系列可能的命名。

当出现已定义的类、函数、模块和变量时，基本补全就会启动。

此外，PyCharm 也提供智能补全等其他补全功能，但基本上都需要对已有文本进行搜索，根据位置和类型判断补全的方法。这些方法都没有配置机器学习模型。

网友评价

项目开源后，有些网友对作者提出了质疑：

「我们已经有很多很好用的自动补全工具了，比如 kite（一个可以在 IDE 上使用的插件），为什么还要费心搞个机器学习模型？」

在讨论中，有人提出，一些无良的自动补全工具会悄悄上传代码到他们的服务器中，（而自行训练的深度学习模型不存在这个问题）。

也有人提出，其实不一定要用 LSTM 模型，隐马尔科夫模型在处理序列数据上效果也很好。

此外，也有网友建议使用 CuDNN 加速 LSTM 的推断过程。这样能大大提升推断速度，集成到 IDE 中也就有了可能。

对于使用深度学习自动补全代码，你有什么想法呢？

欢迎小伙伴留言评论。如有帮助，欢迎点赞+转发分享。

欢迎大家关注民工哥的公众号：民工哥技术之路