Relay TensorRT 集成

1 月 30 日
阅读 5 分钟
121
NVIDIA TensorRT 是一个用于优化深度学习推理的库。这种集成尽可能多地将算子从 Relay 迁移到 TensorRT,无需对 schedule 调优,即可提升 NVIDIA GPU 的性能。
封面图

TorchServe 详解:5 步将模型部署到生产环境

2023-01-04
阅读 3 分钟
1.7k
内容导读TorchServe 自 2020 年 4 月推出至今,经历了 2 年多的发展,变得愈发成熟和稳定,本文将对 TorchServe 进行全面介绍。
封面图

PyTorch 官方博客:PyTorch Profiler v1.9 详解

2021-09-02
阅读 6 分钟
8.5k
Profiler v1.9 的改进主要针对在运行时和/或内存上能耗最严重的执行步骤,同事将 GPU 和 CPU 之间的工作负载分配进行可视化。

PyTorch 官方教程:撸一个神经网络

2021-07-27
阅读 3 分钟
7.5k
本文为 PyTorch 官方教程中:如何构建神经网络。基于 PyTorch 专门构建神经网络的子模块 torch.nn 构建一个简单的神经网络。

高性能、高适配,SSD 孪生兄弟出场即 C 位

2021-07-01
阅读 4 分钟
4.6k
内容导读PyTorch 1.9 同步更新了一些库,包括 TorchVision 中新增的 SSD 和 SSDlite 模型,与 SSD 相比,SSDlite 更适用于移动端 APP 开发。

一文掌握 MobileNetV3 在 TorchVision 中的实现细节

2021-06-10
阅读 6 分钟
7.9k
MobileNetV3 架构的实现严格遵守了原始论文中的设定,支持用户自定义,为构建分类、目标检测和语义分割 Backbone 提供了不同的配置。 它的结构设计与 MobileNetV2 类似,两者共用相同的构建模块。

PyTorch 大杀器:用 AdaptDL 优化 GPU 集群中的 EDL

2021-03-30
阅读 4 分钟
2.3k
内容导读 AdaptDL 是一个资源自适应深度学习训练和调度框架,是 CASL 开源项目的一部分。AdaptDL 的目标是使分布式 DL 在动态资源环境中变得简单和高效。