3090编译Ocean可变形卷积 / Compile Ocean DCN on 3090
see https://github.com/Soarkey/tr...
1.环境 / Environment
- Ubuntu 20
- Python 3.7
- CUDA 11.4
- PyTorch 1.9.0+cu111
2.修改 / Modification
找到lib/models/dcn/src/deform_conv.py
文件, 将所有的AT_CHECK
替换为TORCH_CHECK
, 同时将所有的.view
操作替换为.reshape
操作, 之后重新执行编译python setup.py develop
.
Found file lib/models/dcn/src/deform_conv.py
, replace all AT_CHECK
and .view
operations with TORCH_CHECK
and .reshape
, then recompile python setup.py develop
.
3.可能碰到的问题及解决 / References
> ValueError: Unknown CUDA arch (8.6) or GPU not supported
解决 / Solution
将conda环境所在文件夹中的
cpp_extension.py
内容从:named_arches = collections.OrderedDict([ ('Kepler+Tesla', '3.7'), ('Kepler', '3.5+PTX'), ('Maxwell+Tegra', '5.3'), ('Maxwell', '5.0;5.2+PTX'), ('Pascal', '6.0;6.1+PTX'), ('Volta', '7.0+PTX'), ('Turing', '7.5+PTX'), ]) supported_arches = ['3.5', '3.7', '5.0', '5.2', '5.3', '6.0', '6.1', '6.2', '7.0', '7.2', '7.5']
改为
named_arches = collections.OrderedDict([ ('Kepler+Tesla', '3.7'), ('Kepler', '3.5+PTX'), ('Maxwell+Tegra', '5.3'), ('Maxwell', '5.0;5.2+PTX'), ('Pascal', '6.0;6.1+PTX'), ('Volta', '7.0+PTX'), ('Turing', '7.5+PTX'), ('Ampere', '8.0;8.6+PTX'), ]) supported_arches = ['3.5', '3.7', '5.0', '5.2', '5.3', '6.0', '6.1', '6.2', '7.0', '7.2', '7.5', '8.0', '8.6']
区别在于:增加了8.6的支持, 3090就是属于sm86架构.
- see solution: https://blog.csdn.net/ng323/a...)
> undefined symbol: THPVariableClass
- 原因: 在导入某些和pytorch有关的第三方包时,如果先导入第三方包,容易发生这种错误,正确的做法是首先导入pytorch。
- see solution: https://blog.csdn.net/slow122...
推荐阅读
算法可视化:一文弄懂 10 大排序算法
在本文中,我们将通过动图可视化加文字的形式,循序渐进全面介绍不同类型的算法及其用途(包括原理、优缺点及使用场景)并提供 Python 和 JavaScript 两种语言的示例代码。除此之外,每个算法都会附有一些技术说...
破晓L赞 8阅读 1.1k
思否 CTO 祁宁:社区问答是激荡高级智慧的头脑风暴
在祁宁家里,有一套完整的赛车模拟器,他甚至还请人到国外代购了最新的 VR 设备。作为沉浸式赛车游戏发烧友,除了享受速度与激情带来的愉悦感,祁宁在玩的过程中更多的是思考如何将技术能力进行产品化的问题。
万事ONES赞 6阅读 13k评论 1
编译 PyTorch 模型
本篇文章译自英文文档 Compile PyTorch Models。作者是 Alex Wong。更多 TVM 中文文档可访问 →TVM 中文站。本文介绍了如何用 Relay 部署 PyTorch 模型。首先应安装 PyTorch。此外,还应安装 TorchVision,并将其...
超神经HyperAI赞 1阅读 93.1k
00 后清华学霸用 AI 打败大气层「魔法攻击」,还原宇宙真面貌
内容一览:从诞生的那一刻起,人类对宇宙的探索就从未停止。如今,这门古老的科学再次借助 AI 获得加速度。本文将展示 AI 与天文学的结合擦出了怎样的火花。关键词:AI 天文图像 弱引力透镜
超神经HyperAI阅读 86.2k
借力计算机视觉及深度学习,纽卡斯尔大学开发实时、自动化奶牛跛行检测系统
内容一览:近期,纽卡斯尔大学联合费拉科学有限公司联合开发了一个针对多头奶牛的自动化、实时跛行检测系统。该系统能够按照跛行评分系统将奶牛进行分类,并且准确度高达 94%-100%。目前,该研究成果已发表在《Na...
超神经HyperAI阅读 60.1k
【TVM 学习资料】快速入门:编译深度学习模型
这个例子展示了如何用 Relay Python 前端构建神经网络,并为装有 TVM 的 NVIDIA GPU 生成 runtime 库。注意,构建 TVM 需要启用 CUDA 和 LLVM。
超神经HyperAI阅读 34.3k
活动预告 | 2023 Meet TVM · 北京站定档,5 场 Talk 你最期待哪一场?
内容一览:2023 Meet TVM 线下聚会第二站定档 6 月 17 日!这次我们设定了 5 个 Talk,期待和大家在北京中关村相聚!关键词:编译器 线下活动 2023MeetTVM
超神经HyperAI阅读 20.2k
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。