可以在官網查看經過測試的TensorFlow版本對應的CUDA和Cudnn:https://tensorflow.google.cn/install/source#linux
Tensorflow-gpu安裝
一、環境變量
OS:ubuntu-18.04
編程語言:Python3.6
二、安裝步驟
2.1搞清楚要安裝TensorFlow-GPU版本對應的CUDA和Cudnn,具體如下表:
2.2下載Ubuntu對應版本的驅動,CUDA以及Cudnn(注NVIDIA驅動裝最新版)
NVIDIA驅動(.run)下載地址:https://www.nvidia.cn/Download/index.aspx?lang=cn
CUDA(.run)歷史版本下載地址:https://developer.nvidia.com/cuda-toolkit-archive
cuDNN(.deb)下載地址:https://developer.nvidia.com/rdp/cudnn-archive
2.3 Ubuntu下安裝NVIDIA驅動
1)關閉UEFI Secure Boot選項(很重要)
2)打開終端,刪除舊的驅動:
sudo apt-get purge nvidia* |
3)禁用自帶的 nouveau nvidia驅動
sudo vim /etc/modprobe.d/blacklist-nouveau.conf |
在vim中添加如下內容:
blacklist nouveau options nouveau modeset=0 |
更新,重啟:
sudo update-initramfs -u sudo reboot |
驗證是否已經禁止nouveau nvidia驅動:
lsmod | grep nouveau |
4)進入文本模式安裝驅動:
使用Ctrl+Alt+F4命令切換到文本模式,切換至你下載驅動(.run)的路徑下安裝:
sudo ./NVIDIA.run |
確認是否安裝成功(根據左上角的NVIDIA-SMI即你下載的版本號對應):
nvidia-smi nvidia-settings |
2.3 Ubuntu下安裝CUDA驅動
1)GCC降級:
由於CUDA 9.0僅支持GCC 6.0及以下版本,而Ubuntu 18.04預裝GCC版本為7.3,下載GCC-4.8,g++-4.8版本,並切換至該版本。
sudo apt-get install gcc-4.8 sudo apt-get install g++-4.8
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.8 100 sudo update-alternatives --config gcc |
2)安裝CUDA及其補丁:
sudo sh cuda_10.1.85_387.26_linux.run sudo sh cuda_10.1.85.1_linux.run sudo sh cuda_10.1.85.2_linux.run sudo sh cuda_10.1.85.3_linux.run |
2.3 Ubuntu下安裝cuDNN驅動
直接在相應目錄下執行命令進行安裝(下例版本不對):
sudo dpkg -i libcudnn7_7.0.3.11-1+cuda9.0_amd64.deb sudo dpkg -i libcudnn7-dev_7.0.3.11-1+cuda9.0_amd64.deb sudo dpkg -i libcudnn7-doc_7.0.3.11-1+cuda9.0_amd64.deb
|
驗證cuDNN是否安裝成功:
cp -r /usr/src/cudnn_sample_v7/ $HOME cd $HOME/cudnn_sample_v7/mnistCUDNN make clean && make ./mnistCUDNN
|
2.4 Ubuntu下安裝TensorFlow-gpu==1.14.0
建議先安裝virtualenv,然后在虛擬環境下安裝TensorFlow,當然也可以直接安裝TensorFlow。
安裝過程:https://www.cnblogs.com/SsoZhNO-1/p/11177633.html
當你進入虛擬環境后,安裝TensorFlow-GPU:
# Source ./activate Pip install tensorflow-gpu==1.14.0 |
2.5Ubuntu18.04安裝cuda8
在安裝cuda8和cuda9的時候,都沒有對應Ubuntu18的run文化,對於cuda9我們可以直接安裝ubuntu17,在安裝多個版本的時候。選擇過程如下圖:
其中在安裝cuda8的時候可能會出現如下錯誤:
解決方法:
log中給出了幾個目錄的位置,並且說明在這些目錄下都無法找到InstallUtils.pm(can't locate InstalUtils.pm)
選取多個目錄中的一個,先記錄下來。
我選取的一個是目錄是 /usr/lib/x86_64-linux-gnu/perl5/5.26
打開終端,進入放着cuda 8.0 runfile安裝文件的路徑下面,即 cuda_8.0.61_375.26_linux.run 的路徑下。
具體操作方法如下:
1)解壓runfile文件
$ sh cuda_8.0.61_375.26_linux.run --noexec --target 001 #將runfile文件解壓並且放到001,文件夾中(001可自動創建
|
2)進入解壓后的文件夾,將InstallUtils.pm拷貝到之前我們從log中記錄的文件目錄下,注意可能使用sudo以獲得管理員權限
$ sudo cp InstalUtil.pm ***** #拷貝復制,*****指目標目錄,這里我使用的是/usr/lib/x86_64-linux-gnu/perl5/5.26 |
3)輸入export $PERL5LIB
$ export $PERL5LIB |
再次嘗試運行cuda 8.0 的runfile文件,安裝成功!
參考:https://blog.csdn.net/u014529295/article/details/78820414
!
在安裝多版本cuDNN的時候(原來是7.4,現在換成了6):
至此,版本從1.14.0退回到了1.4.0
切換CUDA版本
sudo rm -rf /usr/local/cuda #刪除之前創建的軟鏈接 sudo ln -s /usr/local/cuda-8.0 /usr/local/cuda #創建新 cuda 的軟鏈接
|
Roi_pooling動態庫編譯
一、環境變量
OS:Ubuntu18.04
編程語言:python3.6
深度學習框架:TensorFlow-GPU==1.14.0
二、安裝步驟
Bash Code/DeepLogo_v2.1_gpu/Lib/make.sh |
(該腳本代碼和原代碼不同,已經被我改成適應該版本代碼)