CUDA¶
记录在 Linux(Ubuntu) 上折腾 CUDA 环境的那些事。
NVIDIA Driver & PyTorch¶
在 Ubuntu20.04 上安装了最新的 NVIDIA Driver(550.54.14) 和 CUDA Toolkit(12.4), 然后发现在 Anaconda 的环境下可以正常用 CUDA,但是在 Python 起的 venv 上没办法用1。 报错信息为RuntimeError: Found no NVIDIA driver on your system
.
这就是比较奇怪的地方:如果 Driver 不能用,那么 Anaconda 为什么就可以正常使用呢? 但是现在的报错就是说了在 venv 上没办法找到 Driver,所以我觉着问题还是出在 Driver 上2。
但是问题并不在 Driver 上...这里报错的含义更多的是当前 Python 环境无法和 GPU 正常通信, 所以也可能是 Python venv 的问题。
注意到这个问题是偶然发现用 Python3.10 和 Python3.12 生成的 venv 都可以正常用 CUDA,只有 3.11 不行——这就更奇怪了... 然后看了下这个 Python3.11 到底有什么不同,which python3.11
返回/home/linuxbrew/.linuxbrew/bin/python3.11
3! 这个东西还要从我发现Homebrew on Linux说起... 总之,就是安装的这个 Python 有问题,导致基于它新建的 venv 就会出现上面莫名奇妙的问题 Orz.
把 linuxbrew 的这个 Python3.11 卸载掉,然后用 apt 安装sudo apt install python3.11
即可。