1.背景
租用的服務器,里面安裝的cuda版本是cuda10.1,需要配套的tensorflow-gpu在1.13.1以上,我之前用的是cuda9.0,cudnn7.6.0,tensorflow-gpu=1.8
不想再修改實驗代碼,所以就打算安裝多版本的cuda
2.安裝
先去cuda官網下載需要的cuda版本
https://developer.nvidia.com/cuda-toolkit-archive
我下載的是cuda_9.0.176_384.81_linux.run
cd cuda_9.0.176_384.81_linux.run
- 1
進入到cuda_9.0.176_384.81_linux.run文件所在的目錄中(前面的cuda_9.0.176代表cuda的版本,后面的384.81代表的對應的NVIDIA驅動的版本)
先執行下面的命令安裝相關依賴,
否則會出現Missing recommended library
錯誤
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
- 1
開始安裝
sudo sh cuda_9.0.176_384.81_linux.run
- 1
#直接按q退出協議說明. accept/decline/quit: accept #接受協議 Install NVIDIA Accelerated Graphics Driver...? y)es/(n)o/(q)uit: n #已經安裝顯卡驅動,選擇n Install the CUDA 9.0 Toolkit? (y)es/(n)o/(q)uit: y #是否安裝工具包,選擇y Enter Toolkit Location [ default is /usr/local/cuda-9.0 ]: #工具包安裝地址,默認回車即可 Do you want to install a symbolic link at /usr/local/cuda? (y)es/(n)o/(q)uit: y #添加鏈接注意這個連接,如果你不想使用之前安裝過的另一個版本的cuda #要使用新版本的,就選擇y,否則這里就建議選n,因為指定該鏈接后會將cuda指向這個新的版本 Install the CUDA 9.0 Samples? (y)es/(n)o/(q)uit: y #安裝樣例 Enter CUDA Samples Location [ default is /root ]: #樣例安裝地址默認即可
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
配置cuda的環境變量,修改vim ~/.bashrc
文件,在末尾添加
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64 export PATH=$PATH:/usr/local/cuda/bin export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
- 1
- 2
- 3
使用
source ~/.bashrc
- 1
使得配置生效
3.多個版本切換
可以在/usr/local/目錄下查看自己安裝的cuda版本
cd /usr/local/ ls
- 1
- 2
我們安裝了cuda10.1,cuda9.0,而cuda是一個軟鏈接,它指向我們指定的cuda版本
在設置環境變量時,使用的是cuda,而不是cuda-10.1和cuda-9.0,主要是方便我們切換cuda版本,不用每次都去設置環境變量的值
stat cuda
- 1
查看cuda,發現文件類型是symbolic link,而指向的目錄正是/usr/local/cuda-9.0,當我們想使用cuda-10.1版本時,只需要刪除該軟鏈接,然后重新建立指向cuda-10.1版本的軟鏈接即可
sudo rm -rf cuda sudo ln -s /usr/local/cuda-10.1 /usr/local/cuda