ubuntu16.04在GTX1070環境下安裝 cuda9.1


設備要求

  • 系統:Ubuntu16.04

  • 顯卡:GTX 1070

  • 驅動:nvidia系列,顯卡驅動的版本必須大於等於cuda的sh文件名里面的版本號

    驅動可從 此處 下載,我已經整理好了

檢查安裝驅動

nvidia-smi

顯示如下信息
在這里插入圖片描述
如果完全無反應或者驅動型號小於cuda的sh文件名里面的版本號則需要重新安裝驅動。
首先去官網下載符合GPU的驅動。

1、刪除舊的驅動

sudo apt-get purge nvidia*

2、禁用自帶的nouveau nvidia驅動

看下nouveau 是否已經被禁用

lsmod | grep nouveau

如果沒有任何顯示說明表示已經被禁用,否則繼續下面操作
修改/etc/modprobe.d/blacklist.conf,添加以下內容

blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist rivatv
blacklist nvidiafb

新建blacklist-nouveau.conf文件,

sudo vim /etc/modprobe.d/blacklist-nouveau.conf #創建一個文件(注:按一下i鍵,表示現在進行內容插入)

並添加如下內容:

blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

再更新一下:

sudo update-initramfs –u

確認下Nouveau是已經被禁用:

lsmod | grep nouveau 

沒有輸出什么東西,說明已經成功關閉了。

3、關閉X-window服務

Ctrl+Alt+F1切換到無桌面命令終端:這里lightdm是你自己的顯示管理器,也可能是gdm,kdm,到底是哪一個可以使用 cat /etc/X11/default-display-manager進行查看,然后修改,並關閉顯示管理器。

sudo service lightdm stop

此時正式進入終端界面:

Login:用戶賬號
Password:用戶密碼

安裝,注意:這里的參數(–no-opengl-files)很關鍵:

cd  /home/xxx/tmp # 導到你的下載的驅動放在哪里的地址
sudo sh NVIDIA-Linux-x86_64-418.56.run --no-opengl-files

按照如下步驟安裝:

(1)accept

(2)contiuned install

后面默認yes安裝就好了

啟動顯示器:(lightdm只是我的顯示管理器,你可能是前面的說的gdm)

sudo service lightdm start

然后按Ctrl+Alt+F7 進入到桌面進行操作

檢查是否成功

nvidia-smi

這里會顯示顯卡信息
在這里插入圖片描述

驅動已經正常安裝了,可以進行下面操作了。

安裝cuda9.1

首先去官網下載cuda9.1, 下載那個1.6G的.run文件,下載完畢就可以正式安裝了。

進入下載目錄,給文件添加運行權限:

chmod +x ./cuda_9.1.85_387.26_linux.run

運行安裝

sudo ./cuda_9.1.85_387.26_linux.run

啟動安裝程序,一直按空格到最后(可以選擇Ctrl+c跳過),不用擔心,到99%的時候,輸入accept接受條款

注意:第一個提醒你是否安裝驅動時,選“n”,其余都“y”

安裝完畢后就需要添加環境了,這步很重要!!!

gedit ~/.bashrc

把下面的內容添加到最后:

export CUDA_HOME=/usr/local/cuda

export PATH=$PATH:$CUDA_HOME/bin

export LD_LIBRARY_PATH=/usr/local/cuda-9.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

測試是否安裝成功

nvcc -V

如果你看到以下顯示,cuda9.1 已經裝好了!

在這里插入圖片描述

安裝cudnn7.x

注冊一個賬號,去官網上下載cudnn7.x。

選擇適配Linux的,類似 cuDNN v7.0.5 Library for Linux

下載完直接解壓,解壓會出現一個cuda文件夾,里面有兩個文件include 和 lib64,把里面的文件copy到/usr/local/cuda/里面相應的目錄里。 如果你就在local下解壓的就不要移動了。只需要給文件加讀權限即可!

sudo chmod a+x /usr/local/cuda/include/cudnn.h
sudo chmod a+x /usr/local/cuda/lib64/libcudnn*

然后更新網絡連接:

cd /usr/local/cuda/lib64/  
sudo chmod +r libcudnn.so.7.0.5  # 自己查看.so的版本  
sudo ln -sf libcudnn.so.7.0.5. libcudnn.so.7  
sudo ln -sf libcudnn.so.7 libcudnn.so  
sudo ldconfig 

查看cudnn版本,檢查是否安裝好:

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

如果顯示類似如下信息,表示安裝成功

在這里插入圖片描述

卸載CUDA以及CUDNN

(1)卸載CUDA

sudo /usr/local/cuda-9.0/bin/uninstall_cuda_9.0.pl 

(2)卸載CUDNN,刪除原來的cudnn文件:

sudo rm -rf /usr/local/cuda-9.0/lib64/libcudnn*
sudo rm -rf /usr/local/cuda-9.0/include/cudnn.h

參考:


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM