技术编辑:宗恩丨发自 SiFou Office
SegmentFault 思否报道丨公众号:SegmentFault
自从 2012年以来许多机器学习框架都争先恐后地要成为研究人员和行业从业者的新宠。从早期的学术性的 Caffe(卷积神经网络框架)和 Theano(一个基于 Python 的深度学习库),到业界支持的大规模 PyTorch 和 TensorFlow,深度学习框架层出不穷。
到了 2019 年,机器学习框架大战只剩下了两个主要竞争者,那就是 PyTorch 和 TensorFlow。越来越多的研究人员表示 PyTorch 未来会成为机器学习领域最受欢迎的框架。
最近 PyTorch 大幅更新,主要内容为提供标签索引,增加主题分类,更新后内容更加清晰对新手更为友好。
以下为更新内容的详细解读:
提供标签索引
对于PyTorch的新用户,有一个易于发现的按钮,可以直接将他们带到 「60分钟突击」。在它的旁边,有一个按钮可以查看所有的索引,这些索引的设计是为了通过实例快速教授特定的功能。
除了现有的左侧导航栏外,教程现在可以通过多选标签快速过滤。比方说你想查看所有与「生产」和「量化」相关的教程。您可以选择「生产」和「量化」过滤器,如下图所示。
还可以在“教程”主页的底部找到以下其他资源:
- PyTorch 备忘单
- PyTorch 示例
- GitHub 上的教程
PyTorch 官方也增加了新的「使用指南」,比如:
- PyTorch 数据加载(LOADING DATA IN PYTORCH)
- CAPTUM 的模型可解释性(MODEL INTERPRETABILITY USING CAPTUM)
- 如何在 PyTorch 中使用 Tensorboard(HOW TO USE TENSORBOARD WITH PYTORCH)
增加主题分类
本部分包括为 PyTorch 新手用户设计的教程。根据社区反馈,我们对当前的深度学习与 PyTorch 进行了更新。A 60 分钟突击教程,这是最受欢迎的初学者教程之一。
完成后,人们可以理解什么是 PyTorch 和神经网络,并能够构建和训练一个简单的图像分类网络。更新内容包括添加解释以澄清输出含义,并链接到用户可以在文档中阅读更多的内容,清理容易混淆的语法错误,以及重构和解释新的概念,使其更容易阅读。
在生产中部署模型
本部分包括针对希望将其 PyTorch 模型投入生产的开发人员的教程。这些教程包括:
- 通过带有 Flask 的 REST API 在 Python 中部署 PyTorch
- TorchScript 简介
- 在 C ++ 中加载 TorchScript 模型
- 探索从 PyTorch 到 ONNX 的模型并使用 ONNX Runtime 运行它
前端 API
PyTorch 提供了许多前端 API 功能,可以帮助开发人员更有效地编码,调试和验证其模型。本节包括一些教程,这些教程教这些功能是什么以及如何使用它们。一些教程重点介绍:
- PyTorch 中的命名张量简介
- 使用 PyTorch C ++ 前端
- 使用自定义 C ++ 运算符扩展 TorchScript
- 使用自定义 C ++类扩展 TorchScript
- C ++ 前端中的 Autograd
模型优化
深度学习模型由于其复杂性,通常会消耗大量的内存,功能和计算资源。本节提供模型优化的教程:
- 修剪
- BERT 上的动态量化
- 在 PyTorch 中使用 Eager 模式进行静态量化
并行和分布式培训
PyTorch 提供了可以提高研究和生产性能的功能,例如对集体操作的异步执行的本机支持以及可从 Python 和 C ++ 访问的对等通信。本节包括有关并行和分布式培训的教程:
- 单机模型并行最佳实践
- 分布式数据并行入门
- 分布式 RPC 框架入门
- 使用分布式 RPC 框架实现参数服务器
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。