PyTorch1.2 + CUDA10.0 + cuDNN7.6 + Anaconda3配置
目標:
-
在2080Ti GPU上,運行PyTorch 1.2 GPU版本。
-
經過確認,PyTorch 1.2可以搭配CUDA 10.0,而CUDA 10.0搭配cuDNN 7.6(官網下載頁面可以直接看到)。
-
安裝Anaconda,創建一個py3.6的pytorch環境。
具體步驟:
-
參考這個教程,安裝NVIDIA驅動。
注意安裝時加上
-no-opengl-files
參數,防止登錄自循環。 -
安裝CUDA10.0
-
到NVIDIA官網,下載CUDA Toolkit 10.0的runfile版本。官網上提供了安裝指令。但不要照做。后面細說。
-
將文件轉移到服務器的某路徑下,執行:
sudo sh cuda_xxx.run
。 -
長按空格跳過說明。
Install NVIDIA Accelerated
選擇no
,其他默認或y
。 -
安裝完畢,警告是因為剛剛選了個
n
,沒關系。 -
編輯環境變量:
sudo vim ~/.bashrc
,添加以下三行:export CUDA_HOME=/usr/local/cuda export PATH=$PATH:$CUDA_HOME/bin export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
-
激活:
source ~/.bashrc
。 -
測試:最后看到PASS就成功了!
cd /usr/local/cuda/samples/1_Utilities/deviceQuery sudo make ./deviceQuery
-
-
安裝cuDNN7.6
-
NVIDIA官網下載。需要注冊。從今往后可能要多次安裝下載,可以記住密碼。注意對應CUDA 10.0版本。我選擇
cuDNN Library for Linux
。 -
轉移到服務器,
tar xvf cudnnxxx
解壓。 -
執行以下操作:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ sudo chmod a+r /usr/local/cuda/include/cudnn.h sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
-
完成!可查看版本:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
。
-
-
安裝Anaconda
-
在官網查看最新版本的鏈接,在服務器直接
wget xxx
下載。例如wget https://repo.anaconda.com/archive/Anaconda3-2019.07-Linux-x86_64.sh
。或者用迅雷下,很快。 -
安裝,一切默認。
-
如果剛剛沒有選
y
激活,那么就手動在命令行激活:conda init bash
,重新打開terminal。 -
切換為國內源:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
-
還可以增加Anaconda關於PyTorch的國內源:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
-
創建環境
pt1.2_py3.6
:conda create -n pt1.2_py3.6 python=3.6
。 -
激活該環境:
conda activate pt1.2_py3.6
。
-
-
安裝PyTorch和Torchvision
在該環境下,
conda install pytorch=1.2
,conda install torchvision
即可。常用:
conda install scikit-image
,conda install numpy
。