CUDA¶
记录在Linux(Ubuntu)上折腾CUDA环境的那些事。
NVIDIA Driver & PyTorch¶
在Ubuntu20.04上安装了最新的NVIDIA Driver(550.54.14)和CUDA Toolkit(12.4), 然后发现在Anaconda的环境下可以正常用CUDA,但是在Python起的venv上没办法用1。 报错信息为RuntimeError: Found no NVIDIA driver on your system
.
这就是比较奇怪的地方: 如果Driver不能用,那么Anaconda为什么就可以正常使用呢? 但是现在的报错就是说了在venv上没办法找到Driver,所以我觉着问题还是出在Driver上2。
但是问题并不在Driver上...这里报错的含义更多的是当前Python环境无法和GPU正常通信, 所以也可能是Python venv的问题。
注意到这个问题是偶然发现用Python3.10和Python3.12生成的venv都可以正常用CUDA,只有3.11不行——这就更奇怪了... 然后看了下这个Python3.11到底有什么不同, which python3.11
返回/home/linuxbrew/.linuxbrew/bin/python3.11
3! 这个东西还要从我发现Homebrew on Linux说起... 总之,就是安装的这个Python有问题,导致基于它新建的venv就会出现上面莫名奇妙的问题Orz.
把linuxbrew的这个Python3.11卸载掉,然后用apt安装sudo apt install python3.11
即可。