深度學習環境搭建——Ubuntu16.04+CUDA9.0+cuDNN7.1+MXNet


心好累,總之還是記錄一下吧,姑且當作備忘。

一、Ubuntu

在這里我選擇的是ubuntu的u盤安裝。

1、所需材料

  • Universal USB Installer
  • ubuntu-16.04-desktop-amd64.iso
  • 一個干凈的U盤

2、步驟

(1) 用Universal制作u盤啟動盤(這里u盤會被格式化)

(2) 重啟電腦,按F2進入BIOS,將u盤設為第一啟動:

我的電腦是聯想拯救者R720,這一步設置u盤啟動項和網上的一般教程不一樣,見圖

 (3)按F10保存退出,進入如下界面:

 我選擇的第一項,之后按照提示進行安裝

(4)基本上沒什么好說的了,特別提一下磁盤分區:

因為我安裝的是雙系統,所以我選擇保留windows,自己調整分區。

網上一般都有分區教程,為什么要特別說明?

因為我信了他們的邪(微笑),直接貼下我自己的分區,也許也不是很好,但是至少我用着沒問題:

交換分區:邏輯分區,swap,2G

主分區:主分區,ext4,掛載到 ‘ / ’    30G(當時看的網上的教程分了16G,結果剛裝完系統空間就滿了。。。)

boot分區:主分區,ext4,掛載到 ‘ /boot ’  500M

tmp分區:主分區,etx4,掛載到 ‘ /tmp ’  5120M

uefi分區:主分區,etx4,掛載到 ’ /boot/uefi ’ 6000M(專門給啟動引導器的分區,將它安裝到這里,不然會安裝失敗)

home分區:邏輯分區,ext4,掛載到 ‘/home ’ 420+G (越大越好,剩下的空間全給了它)

二、CUDA

cuda這里有個深坑——安裝驅動時驅動的版本一定要和你的顯卡還有cuda的版本匹配!!!不然之后安裝cuda的時候就會安裝失敗(報錯:CUDA driver version is insufficient for CUDA runtime version )!!!

直接上步驟:

0、卸載cuda

顯然我之前失敗過很多次,所以我先來介紹一下如何卸載qwq

執行如下語句

1 sudo apt-get remove cuda 
2 sudo apt-get autoclean
3 sudo apt-get remove cuda*
4 cd /usr/local/
5 sudo rm -r cuda-9.0

 1、在CUDA官網下載跟自己顯卡匹配的驅動

https://www.nvidia.cn/Download/index.aspx?lang=cn

執行如下語句,安裝

1 sudo add-apt-repository ppa:graphics-drivers/ppa
2 sudo apt-get update
3 sudo apt-get install nvidia-390
4 sudo apt-get install mesa-common-dev
5 sudo apt-get install freeglut3-dev

重啟電腦

1 sudo reboot

輸入如下語句,如果出現GPU列表/GPU詳細信息,則說明安裝成功

1 nvidia-smi

或者

1 nvidia-settings

2、安裝CUDA

下載cuda的安裝文件:https://developer.nvidia.com/cuda-toolkit-archive

我下載的是runfile文件,但deb文件似乎也可以,我沒有試過。

下載完畢后,執行如下語句,運行runfile文件

1 sudo sh cuda_9.0.176_384.81_linux.run

 一路回車,因為之前安裝了驅動,所以選擇不安裝驅動,之后全部選擇yes,安裝路徑用默認的即可。

執行如下語句,打開profile文件

1 sudo gedit /etc/profile

在文件末尾處添加

1 export PATH=/usr/local/cuda-9.0/bin:$PATH
2 export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64$LD_LIBRARY_PATH

重啟電腦

1 sudo reboot

輸入如下語句測試cuda的samples,如果顯示的是一些關於GPU的信息,則說明安裝成功

1 cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
2 sudo make
3 ./deviceQuery

 ps:注意一下下載的cuda的版本號: cuda_9.0.176_384.81_linux.run ,所謂的坑就是這里了:對應的nvidia的版本號應當大於等於這個版本384.81。記得我們之前安裝的驅動版本是390.77,看來是沒問題了:)

各CUDA版本以及它們對驅動版本的最低要求

 三、cuDNN

不太想寫了qwq,我覺得官方文檔說明的很詳細了。

1、從官網下載安裝

2、測試

四、MXNet

官網下載Anaconda

進入sh文件所在文件夾,執行該sh文件

1 sh Anaconda3-5.0.1-Linux-x86_64.sh

執行以下命令或重啟終端讓conda生效

1 source ~/.bashrc

下載代碼壓縮包,進入文件夾,解壓后執行如下語句

1 mkdir gluon_tutorials_zh && cd gluon_tutorials_zh
2 curl https://zh.gluon.ai/gluon_tutorials_zh.tar.gz -o tutorials.tar.gz
3 tar -xzvf tutorials.tar.gz && rm tutorials.tar.gz

 使用國內鏡像加速下載所需軟件

1 # 使用清華 conda 鏡像。
2 conda config --prepend channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
3 # 或者選用科大 conda 鏡像。
4 conda config --prepend channels http://mirrors.ustc.edu.cn/anaconda/pkgs/free/

使用conda創建虛擬環境並安裝所需軟件

1 conda env create -f environment.yml

激活之前創建的環境

1 source activate gluon

打開jupyter notebook

1 jupyter notebook

成功~

卸載cpu版的mxnet

1 cd ~/gluon_tutorials_zh
2 source activate gluon
3 pip uninstall mxnet

退出虛擬環境

1 source deactivate

更新依賴為gpu版本的mxnet:使用文本編輯器打開之前文件夾下的文件environment.yml,將里面的mxnet替換為mxnet-cu90(依據你的cuda版本而定),保存文件后退出。

更新虛擬環境

1 conda env update -f environment.yml

激活

1 source activate gluon

 

ps:在import mxnet 的時候報了一個錯:

 解決方法:進入/usr/local/cuda-9.0/lib64,檢查是否有libcudart.so.9.0

如果有,執行

1 sudo ldconfig /usr/local/cuda-9.0/lib64

OK~

 

參考文檔:

https://www.linuxidc.com/Linux/2016-04/130520.htm

https://blog.csdn.net/u010837794/article/details/63251725/

http://zh.gluon.ai/chapter_prerequisite/install.html#%E4%BD%BF%E7%94%A8-GPU-%E7%89%88%E7%9A%84-MXNet

https://www.cnblogs.com/Mulns/p/8862438.html

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM