我的机器是 nvidia T4 GPU + ubuntu22.04
我先通过下面的命令安装驱动
sudo apt install -y nvidia-driver-535-server
等电脑重启好了,输入 nvidia-smi
查看显卡信息
╰─➤ nvidia-smi 130 ↵
Mon Sep 18 14:30:16 2023
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.54.03 Driver Version: 535.54.03 CUDA Version: 12.2 |
|-----------------------------------------+----------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+======================+======================|
| 0 Tesla T4 Off | 00000000:AF:00.0 Off | 0 |
| N/A 47C P0 27W / 70W | 2MiB / 15360MiB | 6% Default |
| | | N/A |
+-----------------------------------------+----------------------+----------------------+
可以看到输出的 cuda verison 是 12.2
然后通过 sudo apt-get install nvidia-cuda-dev nvidia-cuda-toolkit
安装 nvcc
但是 nvcc --version
显示的 cuda 版本是 11.5
为什么不一致呢?
╰─➤ cat /usr/local/cuda/version.txt
cat: /usr/local/cuda/version.txt: No such file or directory
不一样可能是由于 Ubuntu 仓库里的 nvidia-cuda-toolkit 包版本和你的 NVIDIA 驱动支持的 CUDA 版本不匹配。你可以去 NVIDIA 官网下载和你的驱动匹配的 CUDA 版本就行。
/usr/local/cuda/version.txt 文件找不到可能是因为 CUDA 安装时候没有建这个文件,或者 CUDA 的安装路径不是 /usr/local/cuda。你试一下用find 命令来找 version.txt 文件: