ubuntu16.04安裝cuda及配置深度學習環境


安裝CUDA-9.0

1、CUDA的安裝比較容易,官網下載9.0版本,選擇對應系統,請下載runfile

2、在下載文件夾終端輸入:

sudo sh cuda_9.0.176_384.81_linux.run

 剛開始一直顯示的是0%,按q退出文件說明,然后關鍵的地方來了,先輸入accept,接着問你要不要安裝CUDA自帶的顯卡;這一個選擇NO,后面3個都是YES。(忘記截圖了)

 3、安裝完成之后需要配置環境變量   

       在終端輸入:

sudo gedit   ~/.bashrc

     會打開一個文件,在這個文件的最后加入以下兩行內容:

  1. export PATH=/usr/local/cuda -9.0/bin${PATH:+:${PATH}}
  2.  
  3. export LD_LIBRARY_PATH=/usr/local/cuda -9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

   可以直接復制粘貼過去,然后點擊保存或者輸入:

source  ~/.bashrc

     在profile中也輸入上面兩行聲明

sudo gedit    /etc/profile

保存退出,reboot一下。

 4、驗證CUDA版本:9.0

       在終端輸入:nvcc -V

    步驟三:安裝cuDNN

1、在官網下載,需要注冊賬號,目前提供的不同版本為:

看圖選版本,千萬千萬別選錯!!!

      這里選擇cuDNN v7.05[Dec 5,2017],for CUDA9.0;

      我自己安裝的是cuDNN  v7.0.5 Library for Linux,這里看自己喜歡什么版本吧;

      但是,CUDA-9.0版本的必須和cuDNN的7.0的版本對應起來。cuDNN版本不能超過7.4頭腦發熱裝了cnDNN版本7.6.4的,后面就出問題了,要改!!!),否則后面安裝tensorflow-gpu會報錯,親測要報錯!!!

下面的cuDNN安裝教程就將就看吧,因為安裝錯了版本,有幾張圖用的是cnDNN7.6.4.38的截圖。

(然后下面是卸載我安裝錯的cuDNN版本,淚奔!乖乖的安裝回原來的版本。)

  1. sudo rm -rf /usr/local/cuda/include/cudnn.h
  2. sudo rm -rf /usr/local/cuda/lib64/libcudnn*

2、在下載路徑解壓文件,復制到本地路徑,這里解壓出來的文件名比較重要

      在下載路徑打開終端,依次執行以下命令:

tar -zxvf cudnn-9.0-linux-x64-v7.6.4.38.tgz 
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/

 

3、到我們本地的cuda路徑,進入lib64文件夾會有剛剛解壓的文件,然后在終端打開依次執行以下命令:

  1. cd /usr/local/cuda/lib64
  2.  
  3. sudo chmod +r libcudnn.so .7.0.5
  4.  
  5. sudo ln -sf libcudnn.so .7.0.5 libcudnn.so.7
  6.  
  7. sudo ln -sf libcudnn.so .7 libcudnn.so
  8.  
  9. sudo ldconfig

在本地cuda路徑檢測一下,在終端輸入:ll

安裝成功會出現以下信息:

 

    步驟四:安裝Anaconda3

1、Anaconda 安裝包可以到 清華源下載;也可以去官網下載 官網

      找到自己需要安裝的Anaconda3的版本。

2、本次使用的是Anaconda3-5.2.0-Linux-x86_64.sh

       到下載路徑在終端打開,執行以下命令:

bash Anaconda3-5.2.0-Linux-x86_64.sh 

  按q跳過介紹,輸入yes

回車:

直到顯示安裝完成。

安裝完成以后在終端輸入:conda list   檢測是否安裝成功。

 這一步如果出現:

conda: command not found
則在終端運行命令:

source ~/.bashrc

 

    步驟五:安裝TensorFlow-gpu

1、因為Python3.6版本的也可以用,對於有強迫症的我選擇了安裝

      添加源並更新命令行:

  1. sudo add-apt-repository ppa:fkrull/deadsnakes
  2.  
  3. sudo apt-get update

      安裝指定版本的python:

 sudo apt-get install python3.6 python3.6-dev

2、我只用了pip安裝,源碼安裝太麻煩沒有采用

       安裝pip:

sudo apt-get install python3-pip

       更新pip:

 pip install   --upgrade pip

3、利用pip來安裝tensorflow-gpu

  1. pip install tensorflow-gpu #(默認下載最新的版本)
  2. pip install tensorflow-gpu== 1.6.0 #(下載1.6版本的,想下載哪個版本自己定)
  3.  

4、測試是否安裝成功

我的第一次導入報錯了,接着再導入就成功了;

查閱資料才知道原因是:

h5py新版本對numpy1.14版本的兼容錯誤

解決辦法:

pip install h5py==2.8.0rc1

 果然消失了。

 

 

                                                         總結

       現在軟硬件更新太快了,以后系統出問題了估計這個方式也不能用了!所以有安裝不上的小伙伴可以留下腳印,大家一起研究交流,共同學習,一起進步。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM