平台信息:
PC:ubuntu16.04、i5、七彩虹GTX1060顯卡
作者:庄澤彬(歡迎轉載,請注明作者)
說明:參考了網上的一堆的資料搭建了深度學習的開發環境,下班在宿舍折騰了好幾個晚上才搞定,寫篇文章記錄一下。
一、安裝Nvidia GTX1060顯卡驅動
1.1 圖1是本人使用的顯卡,暫時沒有那么多錢,買個便宜的玩玩,把顯卡插入電腦主板,然后開啟ubuntu系統,
圖1
1.2 在終端輸入lspci |grep VGA查看顯卡型號,ubuntu系統自帶了nouveau驅動,因此我們啟動系統之后可以識別到顯卡,但這畢竟不是GTX1060專用的顯卡驅動,我們不能使用這個驅動要屏蔽這個顯卡驅動,安裝NVIDIA GTX1060顯卡驅動,我們在看看圖3現在系統使用的是CPU集成顯卡,沒有使用我們的獨立顯卡,我們要切換到我們的GTX1060顯卡.
圖2
圖3
1.3 在終端輸入sudo ubuntu-drivers devices查看自己的系統適合安裝什么版本的顯卡驅動,當然也可以下載最新的,這里自己選擇,本人選擇系統推薦的版本nvidia-384
圖4
到這里鏈接下載對應型號的顯卡驅動:https://www.geforce.cn/drivers,設置見圖5,之后點擊開始搜索,在搜索結果中選擇自己下載的顯卡驅動版本
搜索結果
圖5
1.4
在正式安裝之前執行先卸載原有的顯卡驅動:
sudo apt-get remove --purge nvidia*
禁止nouveau:
sudo vim /etc/modprobe.d/blacklist.conf
在這個文件最后添加:
blacklist nouveau
之后執行sudo update-initramfs -u重啟系統
在終端輸入lsmod | grep no如何沒有輸出信息證明系統沒有加載nouveau驅動,可以進行一下步的操作。
1.5 安裝驅動:
添加可執行權限:
sudo chmod a+x NVIDIA-Linux-x86_64-384.130.run
關閉圖形化環境:
進入控制台模式:ctrl+alt+f1,
sudo /etc/init.d/lightdm stop
正式安裝:
sudo ./NVIDIA-Linux-x86_64-384.130.run -no-x-check -no-nouveau-check -no-opengl-files
執行完之后竟然跳出這個界面圖6這個界面,后找了一下資料,其實出現這個界面是正常的,只是NVIDIA的人提醒你是否要進行安裝,可以看看 /usr/lib/nvidia/pre-install這個文件的內容圖7,其實沒有做什么就退出,所以出現圖6的界面不用擔心,繼續執行就好了啊。
圖6
圖7
在安裝的過程會出現的選項:
Install NVIDIA's 32-bit compatibility libraries?本人選擇yes
Would you like to run the nvidia-xconfig utility to automatically update your X configuration file so that the NVIDIA X driver will be used when you
restart X? Any pre-existing X configuration file will be backed up. 本人選擇NO
等待安裝完畢之后執行
sudo /etc/init.d/lightdm start 恢復圖形界面
查看顯卡驅動版本:從圖8可以看出我們安裝GTX1060顯卡驅動已經搞定了,但是我們系統現在使用的還是圖3所示的集成顯卡,我們安裝完cuda8.0之后就能切換過去,因此革命尚未成功仍需nvli
cat /proc/driver/nvidia/version
nvidia-smi
圖8
如果需要升級版本卸載:sudo ./NVIDIA-Linux-x86_64-384.130.run --uninstall
二、安裝cuda8.0
2.1下載cuda8.0的下載鏈接:https://developer.nvidia.com/cuda-80-ga2-download-archive,本人的下載設置見圖9,之后點擊下載,需要注意的是CUDA包括了CPU計算庫和顯卡驅動,因此在安裝的時候不要重復安裝顯卡驅動,不然前面裝了那么久GTX1060顯卡驅動就白裝了啊。
圖9
2.2、安裝cuda8.0
設置可執行權限
sudo chmod a+x cuda_8.0.61_375.26_linux.run
執行安裝:
安裝過程:
在剛開始安裝的時候會出現一個聲明,本人直接回車到100%看完聲明,進行安裝.
Do you accept the previously read EULA?
accept/decline/quit: accept
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 375.26?
(y)es/(n)o/(q)uit: n
Install the CUDA 8.0 Toolkit?
(y)es/(n)o/(q)uit: y
Enter Toolkit Location
[ default is /usr/local/cuda-8.0 ]:
Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y
Install the CUDA 8.0 Samples?
(y)es/(n)o/(q)uit: y
Enter CUDA Samples Location
[ default is /home/zhuang ]:
Installing the CUDA Toolkit in /usr/local/cuda-8.0 ...
Missing recommended library: libXmu.so
Installing the CUDA Samples in /home/zhuang ...
Copying samples to /home/zhuang/NVIDIA_CUDA-8.0_Samples now...
Finished copying samples.
設置cuda8.0到環境變量
sudo vim /etc/profile
添加如下內容:
export PATH=/usr/local/cuda-8.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64$LD_LIBRARY_PATH
重啟系統:sudo reboot
輸入nvcc -V輸出下面信息正常:
圖10
測試:
cd /home/zhuang/NVIDIA_CUDA-8.0_Samples
make
cd 0_Simple/clock 執行簡單的測試demo
如果需要升級卸載:
cd /usr/local/cuda/bin
sudo ./uninstall_cuda_8.0.pl
若安裝的是deb文件使用這種方式卸載:
sudo apt-get autoremove --purge cuda
三、安裝cudnn5.1
3.1 下載鏈接:https://developer.nvidia.com/rdp/cudnn-archive,下載cudnn5.1需要注冊一個NIVDIA賬號.下載設置見圖10,會得到cudnn-8.0-linux-x64-v5.1.solitairetheme8這個文件.
圖10
solitairetheme8這個格式的文件太奇怪了處理一下:
sudo cp cudnn-8.0-linux-x64-v5.1.solitairetheme8 cudnn-8.0-linux-x64-v5.1.tgz
解壓:
sudo tar -zxvf ./cudnn-8.0-linux-x64-v5.1.tgz
復制頭文件:
cd cuda/include
sudo cp cudnn.h /usr/local/cuda/include
復制庫文件:
cd ../lib64/
sudo cp lib* /usr/local/cuda/lib64/
刪除系統原有的動態庫文件:
cd /usr/local/cuda/lib64/
sudo rm -rf libcudnn.so libcudnn.so.5
sudo ln -s libcudnn.so.5.1.10 libcudnn.so.5
sudo ln -s libcudnn.so.5 libcudnn.so
sudo ldconfig
四、安裝tensorflow
下載對應版本的tensorflow:https://pypi.org/project/tensorflow/#files
查看TensorFlow版本:sudo pip show tensorflow
安裝和卸載命令:pip install tensorflow_gpu==1.1
sudo pip uninstall tensorflow-gpu
但是運行卻包了這個錯誤:
有強迫症患者的看到這堆警告肯定很不爽,后面上網又找了一遍,我們還是用源碼編譯的方式安裝TensorFlow吧。哎,路還很長,搭建深度學習的開發環境容易啊。
四、安裝keras
sudo pip install -U --pre pip setuptools wheel
sudo pip install -U --pre numpy scipy matplotlib scikit-learn scikit-image
pip install keras