Linux 不借助 root 权限安装 CUDA

我们能不能做到不借助 root 权限给 Linux 系统安装 CUDA？

答案是有可能的，但是“丑话说在前面”，显卡驱动需要比较新才行。

那么我们为什么会有这种奇怪的需求呢？一种可能的情况是，服务器因为不同的人使用的版本不一样的原因，无法轻易改动 CUDA 的版本。但是我们作为普通用户，又想使用新版的 CUDA（而更新驱动一般不会对其他用户产生影响，除非他们正在占用显卡）。那么该怎么做呢？

安装 CUDA

拿目前最新的版本 CUDA 10.2 为例。首先，我们在 NVIDIA 官网找到 CUDA 下载链接，选择 runfile：

下载好的文件我们简称为 cuda.run。下载完毕之后，运行安装工具。运行这个文件有两种方法。任选其一即可。

# 方法一：修改文件属性，使其可以运行
chmod +x cuda.run
./cuda.run
# 方法二：直接 sh
sh cuda.run

运行安装工具后，首先是接受 EULA：

如果是旧版本（比如 9.x）的 CUDA，阅读 EULA 的界面会特别长。这里的一个小技巧是，不要按住回车键，而是按住空格键来进行跳过。

这里我们不要安装驱动（Driver），因为驱动一定需要 root 才能够安装。一旦选择，必定会安装失败。我们可以移动光标到这些不需要的项目，然后按下Enter取消勾选：

除了 Toolkit 以外，下面的几个其实也不需要。可以根据情况选择安装（比如可以安装 Samples，后续测试 CUDA 以及 cuDNN 是否安装成功）。这里我选择的是仅安装 Toolkit。

接下来我们的任务，就是修改安装路径到自己的 home 下。默认情况下，

CUDA 会被安装在：/usr/local/cuda-10.2/
Library 会被安装在：/usr/local/cuda-10.2/lib64/

所以我们要对这两个进行修改。打开 Options。如果不安装 Driver 和 Samples，那么这两个不用管。否则也需要修改他们的安装位置。打开 Toolkit Options，然后 Change Toolkit Install Path，修改为/home/<username>/cuda-10.2/：

然后 Done，返回上一级，再选择 Library install path：

并将安装目录修改为：/home/<username>/cuda-10.2/lib64/。如果是 9.x 版本的 CUDA，一旦在前面安装了 CUDA 本体的安装位置，那么 library 的位置会自动变成本体安装目录下的 lib64。

然后就可以开始安装了。

安装完毕之后，需要配置一下 .bashrc，在其下方添加：

export PATH=/home/<username>/cuda-10.2/bin:$PATH
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/<username>/cuda-10.2/lib64/

保存后运行一下 source .bashrc，就可以用 nvcc -V 试试有没有安装成功了。

安装 cuDNN

我们还可以考虑安装 cuDNN。官网下载需要注册并登录：https://developer.nvidia.com/cudnn

下载完 .tar.gz 之后，可以用 tar -zxvf 解压缩，然后将里面的文件拷贝到 CUDA 安装目录下的指定位置即可。具体为：

cp <CUDNN>/cuda/include/cudnn.h <CUDA>/include/
cp <CUDNN>/cuda/lib64/libcudnn* <CUDA>/lib64
chmod a+r <CUDA>/include/cudnn.h <CUDA>/lib64/libcudnn*

到此，CUDA 10.2 与 cuDNN 安装完毕。

但是，有比较大的可能会因为你安装的 CUDA 版本太新，而服务器上的显卡驱动又太旧了（比如是 CUDA 9.0 安装包自带的驱动），那么仍旧是没有办法正常使用的（比如使用 GPU 版的 PyTorch）。想要真正能用，还是要说服管理员将服务器的驱动进行更新。但是可以放心的是，更新了驱动之后，旧版本的 CUDA 依旧是可以用的。

（这篇文章的方法借鉴自：Install Cuda without root - Stack Overflow

Linux 不借助 root 权限安装 CUDA

安装 CUDA

安装 cuDNN

云无月

引用和评论

如何手动安装 ncompress

OpenInfra 基金会董事会宣布加入 Linux 基金会意向，增强开源全球影响力

rocky linux 使用记录

快捷键打开某个窗口(如网页chatGPT)

但是，I/O多路复用中是如何判断文件“可读”/“可写”的？

麒麟系统中theia终端崩溃问题排查小记

【笔记】CentOS 7 中配置 YUM