未經允許,不得轉載。
1、環境
顯卡:Gtx 1080Ti
系統:Ubuntu16.04
並行:cuda11.1和對應的cudnn8.1
軟件:Tensorflow2.4 和 PyTorch1.7
驅動:460.39
cuda鏈接:https://pan.baidu.com/s/1_01EZN_UjQHFyr72ZeFhGA
驅動鏈接:https://pan.baidu.com/s/1fcPakuEOeRPNaSzL1XTEKw
cudnn鏈接:https://pan.baidu.com/s/1JZcH7KDtRCuPZMx9Xk4K3g
提取碼都是:pand
2、驅動安裝
建議先安裝驅動,然后再安裝cuda,雖然安裝cuda的時候會帶有一個驅動程序,但是總是會遇到錯誤。具體方法如下:
chmod +x NVIDIA-Linux-x86_64-460.39.run
sudo ./NVIDIA-Linux-x86_64-460.39.run
然后按照下圖指示選項進行選擇即可。
安裝完成,使用nvidia-smi命令驗證結果:
3、cuda安裝
訪問https://developer.nvidia.com/zh-cn/cuda-downloads,按照下圖進行選擇:
chmod +x cuda_11.1.0_455.23.05_linux.run
sudo sh cuda_11.1.0_455.23.05_linux.run
開始安裝,如果你沒有安裝驅動,直接安裝cuda可能會聚到下面的問題:
查看對應的log文件發現安裝驅動失敗,解決方法就是按照第2步先安裝驅動,然后再安裝cuda。
如果之前安裝過cuda,就會遇到以下界面,選擇Upgrade all。
得到結果,如下圖所示,幾乎成功了。
安裝完成以后,還必須進行以下設置:
編輯~/.bashrc,添加:
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
編輯/etc/profile,添加:
export PATH=/usr/local/cuda/bin:$PATH
創建鏈接文件,打開sudo gedit /etc/ld.so.conf.d/cuda.conf
,在文件中添加:
/usr/local/cuda/lib64
最后執行 sudo ldconfig
,使上述設置立即生效。
4、cudnn安裝
在NIVIDA開發者官網上,找到cudnn的下載頁面: https://developer.nvidia.com/rdp/cudnn-download ,選擇合適的cudnn,然后在安裝完成cuda以后,執行以下命令,就可以完成cudnn的安裝了。
PS: cudnn下載必須要登錄,比較麻煩,如果和筆者配置差不多的機器,可以用筆者傳到百度雲的鏈接下載。
cp cudnn-11.2-linux-x64-v8.1.0.77.solitairetheme8 cudnn-11.2-linux-x64-v8.1.0.77.tgz
sudo tar -xzf cudnn-11.2-linux-x64-v8.1.0.77.tgz -C /usr/local
5、Tensorflow2.4安裝
安裝最新版的非常簡單,直接通過pip安裝即可。
pip install tensorflow-gpu -U
如果沒有配置好驅動、cuda、cudnn的情況,運行tensorflow會遇到以下問題。
安裝成功的情況下就如下圖所示。
6. PyTorch 1.7 安裝
按照官網提示的命令進行安裝,直接通過pip安裝即可,注意選擇好對應的cuda版本。
pip install torch==1.7.1+cu110 torchvision==0.8.2+cu110 -f https://download.pytorch.org/whl/torch_stable.html