ubuntu16.04+七彩虹GTX1060的NVIDIA驅動+Cuda8.0+cudnn5.1+tensorflow+keras搭建深度學習環境【學習筆記】【原創】


平台信息:
PC:ubuntu16.04、i5、七彩虹GTX1060顯卡

作者:庄澤彬(歡迎轉載,請注明作者)

說明:參考了網上的一堆的資料搭建了深度學習的開發環境,下班在宿舍折騰了好幾個晚上才搞定,寫篇文章記錄一下。

一、安裝Nvidia GTX1060顯卡驅動

  1.1 圖1是本人使用的顯卡,暫時沒有那么多錢,買個便宜的玩玩,把顯卡插入電腦主板,然后開啟ubuntu系統,

  

圖1

  1.2 在終端輸入lspci |grep VGA查看顯卡型號,ubuntu系統自帶了nouveau驅動,因此我們啟動系統之后可以識別到顯卡,但這畢竟不是GTX1060專用的顯卡驅動,我們不能使用這個驅動要屏蔽這個顯卡驅動,安裝NVIDIA GTX1060顯卡驅動,我們在看看圖3現在系統使用的是CPU集成顯卡,沒有使用我們的獨立顯卡,我們要切換到我們的GTX1060顯卡.

 

 圖2

圖3

  1.3 在終端輸入sudo ubuntu-drivers devices查看自己的系統適合安裝什么版本的顯卡驅動,當然也可以下載最新的,這里自己選擇,本人選擇系統推薦的版本nvidia-384

  圖4

  到這里鏈接下載對應型號的顯卡驅動:https://www.geforce.cn/drivers,設置見圖5,之后點擊開始搜索,在搜索結果中選擇自己下載的顯卡驅動版本

 

搜索結果

圖5

   1.4

  在正式安裝之前執行先卸載原有的顯卡驅動:

  sudo apt-get remove --purge nvidia*

  禁止nouveau:

  sudo vim /etc/modprobe.d/blacklist.conf

  在這個文件最后添加:

  blacklist nouveau  

  之后執行sudo update-initramfs -u重啟系統

  在終端輸入lsmod | grep no如何沒有輸出信息證明系統沒有加載nouveau驅動,可以進行一下步的操作。

  

  1.5 安裝驅動:

  添加可執行權限:

  sudo chmod a+x NVIDIA-Linux-x86_64-384.130.run

  關閉圖形化環境:

  進入控制台模式:ctrl+alt+f1,

  sudo /etc/init.d/lightdm stop

  正式安裝:

  sudo ./NVIDIA-Linux-x86_64-384.130.run -no-x-check -no-nouveau-check -no-opengl-files

  執行完之后竟然跳出這個界面圖6這個界面,后找了一下資料,其實出現這個界面是正常的,只是NVIDIA的人提醒你是否要進行安裝,可以看看 /usr/lib/nvidia/pre-install這個文件的內容圖7,其實沒有做什么就退出,所以出現圖6的界面不用擔心,繼續執行就好了啊。

  

 圖6

  

 

圖7

 

  在安裝的過程會出現的選項:

 Install NVIDIA's 32-bit compatibility libraries?本人選擇yes

 Would you like to run the nvidia-xconfig utility to automatically update your X configuration file so that the NVIDIA X driver will be used when you 

    restart X? Any pre-existing X configuration file will be backed up.  本人選擇NO

 等待安裝完畢之后執行

 sudo /etc/init.d/lightdm start 恢復圖形界面

 查看顯卡驅動版本:從圖8可以看出我們安裝GTX1060顯卡驅動已經搞定了,但是我們系統現在使用的還是圖3所示的集成顯卡,我們安裝完cuda8.0之后就能切換過去,因此革命尚未成功仍需nvli 

 cat /proc/driver/nvidia/version

 nvidia-smi 

    

圖8

 如果需要升級版本卸載:sudo ./NVIDIA-Linux-x86_64-384.130.run  --uninstall

  

 二、安裝cuda8.0

  2.1下載cuda8.0的下載鏈接:https://developer.nvidia.com/cuda-80-ga2-download-archive,本人的下載設置見圖9,之后點擊下載,需要注意的是CUDA包括了CPU計算庫和顯卡驅動,因此在安裝的時候不要重復安裝顯卡驅動,不然前面裝了那么久GTX1060顯卡驅動就白裝了啊。

  

 

圖9

  2.2、安裝cuda8.0

  設置可執行權限

  sudo chmod a+x cuda_8.0.61_375.26_linux.run

  執行安裝:

  安裝過程:

  在剛開始安裝的時候會出現一個聲明,本人直接回車到100%看完聲明,進行安裝.  

Do you accept the previously read EULA?
accept/decline/quit: accept

 

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 375.26?
(y)es/(n)o/(q)uit: n

 

Install the CUDA 8.0 Toolkit?
(y)es/(n)o/(q)uit: y

 

Enter Toolkit Location
[ default is /usr/local/cuda-8.0 ]:

 

Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y

 

Install the CUDA 8.0 Samples?
(y)es/(n)o/(q)uit: y

 

Enter CUDA Samples Location
[ default is /home/zhuang ]:

 

Installing the CUDA Toolkit in /usr/local/cuda-8.0 ...
Missing recommended library: libXmu.so

 

Installing the CUDA Samples in /home/zhuang ...
Copying samples to /home/zhuang/NVIDIA_CUDA-8.0_Samples now...
Finished copying samples.

  設置cuda8.0到環境變量

  sudo vim /etc/profile

  添加如下內容: 

  export PATH=/usr/local/cuda-8.0/bin:$PATH
  export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64$LD_LIBRARY_PATH

  重啟系統:sudo reboot

  輸入nvcc -V輸出下面信息正常:

圖10

 

測試:

cd /home/zhuang/NVIDIA_CUDA-8.0_Samples 

make 

cd 0_Simple/clock  執行簡單的測試demo

 

如果需要升級卸載: 

  cd /usr/local/cuda/bin

  sudo ./uninstall_cuda_8.0.pl

若安裝的是deb文件使用這種方式卸載:

  sudo apt-get autoremove --purge cuda

 

三、安裝cudnn5.1

  3.1 下載鏈接:https://developer.nvidia.com/rdp/cudnn-archive,下載cudnn5.1需要注冊一個NIVDIA賬號.下載設置見圖10,會得到cudnn-8.0-linux-x64-v5.1.solitairetheme8這個文件.

  

圖10

solitairetheme8這個格式的文件太奇怪了處理一下:

sudo cp cudnn-8.0-linux-x64-v5.1.solitairetheme8 cudnn-8.0-linux-x64-v5.1.tgz

解壓: 

sudo tar -zxvf ./cudnn-8.0-linux-x64-v5.1.tgz

復制頭文件:

cd cuda/include

sudo cp cudnn.h /usr/local/cuda/include

復制庫文件:

cd ../lib64/

sudo cp lib* /usr/local/cuda/lib64/

刪除系統原有的動態庫文件:

cd /usr/local/cuda/lib64/ 

sudo rm -rf libcudnn.so libcudnn.so.5

sudo ln -s libcudnn.so.5.1.10 libcudnn.so.5

sudo ln -s libcudnn.so.5 libcudnn.so

 sudo ldconfig

 

四、安裝tensorflow

 下載對應版本的tensorflow:https://pypi.org/project/tensorflow/#files

查看TensorFlow版本:sudo pip show tensorflow

安裝和卸載命令:pip install tensorflow_gpu==1.1

sudo pip uninstall tensorflow-gpu

但是運行卻包了這個錯誤:

有強迫症患者的看到這堆警告肯定很不爽,后面上網又找了一遍,我們還是用源碼編譯的方式安裝TensorFlow吧。哎,路還很長,搭建深度學習的開發環境容易啊。

四、安裝keras

sudo pip install -U --pre pip setuptools wheel

sudo pip install -U --pre numpy scipy matplotlib scikit-learn scikit-image

 

 pip install keras


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM