ubuntu14.04系統安裝、NVIDIA顯卡驅動安裝及CUDA8.0、Cudnn5.1的環境搭建


安裝環境hp-Z440工作站、64Ubuntu14.04(64Ubuntu16.04)Cuda8.0Cudnn5.1Nvidia GeForce GT 705Tesla K40c

本文可解決的問題:如何完全清空硬盤數據、Ubuntu系統啟動U盤的制作、Ubuntu14.04系統安裝、Ubuntu系統無線上網環境配置、NVIDIA驅動的安裝、Cuda8.0環境安裝與配置、Cudnn 5.1的安裝及配置。

經過:由於項目需要,我們需要在Ubuntu系統上搭建tensorflow版的faster rcnnUbuntu系統,和Windows系統相比,這款系統能根據個人需求定制,空間小,但是由於使用范圍較小,維護人員少,故而系統不夠穩定。在安裝Ubuntu系統的痛苦過程中(大概花了一周我們從14.04版裝到16.04版后來又由於某種條件限制又裝回14.04版),由於安裝環境的差異,我們大致遇到了以下幾個問題:(1)安裝14.04版后界面分辨率選項只有一個不可調、安裝更新顯卡驅動后依然出現這種情況;(2)經過多次安裝,上述問題仍然未能解決,桌面顯示不便於使用。於是,我們選擇安裝16.04版本,分辨率選項依然只有一個,但桌面顯示比之前要好很多。由於當時網上下載的16.04版內核版本是4.10不太適合我們使用。(有人在博客中提出之前NVIDIA驅動不能與內核4.10Ubuntu16.04兼容,后來又在回復我的評論中提出下載NVIDIA官網最新驅動是可以兼容的);(3)我們想要找到內核版本為4.4Ubuntu16.04,找了很久並未找到,由於在網上下載鏡像文件時並未提供系統內核信息,我們只能等裝好系統后用uname –r命令查看系統內核。后來東找西找在官網找了Ubuntu16.04,官網介紹里說內核是4.4,於是我們開始安裝這個系統,然而,這次安裝我花了兩天才安上發現內核也是4.10,出現很多問題。比如,唯一一次我順順利利裝好重啟后發現居然進到我之前安裝的Ubuntu16.04里去了(因為之前Ubuntu16.04里有我保存的文件被我發現了),可是在安裝系統過程中我在步驟中選擇了卸載之前Ubuntu16.04版本啊,當時很懊惱,無法解決;還有,報錯PXE-E61Media test failure, check cablePXE-MOFExiting Intel Boot Agent,當時按照網上解決辦法更改bios設置,將硬盤設為第一啟動設備解決了這個問題。然后,我重做鏡像重新安裝,可是又報了與Ubuntu系統自帶通用顯卡驅動nouveau相關的錯誤:8.202321] nouveau 0000:02:00.0:bus:MMIO read of 00000000 FAULT at 3e6684[IBUS],對於一個新手,這個問題太犯難了,而且百度根本搜不到解決方法,這時我們還是能夠進入到安裝界面的,但是總是安裝不上,有時會提示安裝程序崩潰,不得不說這個系統是真的不夠穩定。由於每次安裝失敗再安裝發現又遇到新的問題,比如,連安裝界面都不能進去了,我猜測安裝過程會損壞U盤鏡像?(如果有讀者知曉這個問題可以留言告訴我,表示感謝!)當然我不確定,於是我只能重做鏡像、重新安裝,裝了一天從早到晚,並未裝上;(4)后來,在導師的當機立斷下,換顯卡,猜測是顯卡支持不好導致的。hp-Z440工作站自帶的獨顯是Quadro K620,當時導師猜測Quadro系列顯卡並不多見,也許是Ubuntu系統對它的支持不好。七找八找,把獨顯換成了Nvidia GeForce GT 705。(說明一下:hp-Z440工作站自帶獨顯Quadro K620、主板集成顯卡,另外我們由於要跑深度學習相關實驗,又擴展了一塊顯卡Tesla K40c,這樣一來我們的主機上一共有三塊顯卡)更換顯卡后,我們又重新安裝了內核版本為4.4Ubuntu14.04,隨后裝了相關顯卡驅動、以及配置Cuda8.0cudnn環境、一氣呵成,大功告成!!!

感謝:感謝導師為我耐心解答各種問題,督促我,與我一起解決實際問題!!!這次裝機過程,學會了很多實用技能,比如拆電腦,了解電腦主機構造,熟悉Linux命令等等!!!

參考blog

1.http://www.linuxidc.com/Linux/2016-11/137561.htm

2.http://blog.csdn.net/tianrolin/article/details/52830422

3.https://zm12.sm-tc.cn/?src=l4uLj8XQ0J2TkJjRnIybkdGRmovQis%2FOzsfHxsbKzdCejYuWnJOa0Juai56Wk4zQyMjIy8nJycc%3D&uid=78161a137e5bc7faf84f0891713f6af1&hid=626f990e7694c604eb9ffdb49ce83eee&pos=6&cid=9&time=1515330695977&from=click&restype=1&pagetype=0000000002000408&bu=web&query=%E6%AD%A3%E5%9C%A8%E8%AE%BE%E7%BD%AENVIDIA%E2%80%93diag%E2%80%93driver%E2%80%93local%E2%80%93repo&mode=&v=1&force=true&wap=false&uc_param_str=dnntnwvepffrgibijbprsvdsdichei

4.http://blog.csdn.net/zafir_410/article/details/73188228

5.http://blog.csdn.net/weixin_38208741/article/details/71459257

6.http://wxhp.org/ubuntu-install-nvidia-official-drivers.html

7.http://m.zhimengzhe.com/linux/161425.html

8.https://m.jb51.net/os/Ubuntu/331812.html

本文作者吳疆,轉載請備注!

安裝步驟如下:

一、 完全清空硬盤數據

前面提到,在某次裝好系統后重啟居然進到之前裝的系統,可我在安裝Ubuntu系統這一步(如圖所示)我選擇卸載后(若之前安裝過Ubuntu系統才有“卸載”這個選項,下圖是我格式化硬盤后的選擇界面,此時提示該硬盤未裝過系統,故無上述“卸載…”)

然后再關機重啟再重新進入安裝頁面重復過程在這一頁面里選其他選項。之前安裝過程從未出現過這種進入到舊系統的情況(按理說這里選擇卸載之前的系統是可以將之前系統完全刪除干凈的),所以一直以為是完全清空的。由於高級格式化(普通的格式化都是高格)無法完全恢復硬盤,我們想用低格工具對硬盤進行低格,找到window7 啟動盤想用內帶的diskgenius DOS版里的LFORMAT命令對硬盤進行低格,發現無法識別該硬盤,或許是由於此種操作無法識別固態硬盤?於是導師想了一招,把winhex工具放在window7 啟動盤里進入系統,使用winhex工具對硬盤進行填0操作,具體填0操作如下:菜單欄選“工具”下的磁盤編輯器,在物理媒介里選擇要填0的硬盤后點擊“是”,隨后在菜單欄選“編輯”下的“全選”選中硬盤內的數據,接着在菜單欄選“編輯”下的“填入選塊”,默認是填入“00”,直接點擊確定,經過漫長的時間(我們1T硬盤花了40min),填0成功,這樣硬盤基本就是恢復到出廠態了。

 

二、 Ubuntu系統啟動U盤的制作

准備好一個格式化(高格即可)過的U盤,官網下載Ubuntu14.04鏡像文件,本人Ubuntu14.04系統網盤鏈接:https://pan.baidu.com/s/1eT20JZk 密碼:gvdf

下載制作Ubuntu系統啟動U盤工具Universal-USB-Installer-2M左右大小,打開該工具,界面顯示如下:Step1框中選擇UbuntuStep2框中選擇鏡像文件、Step3中選擇格式化后的U盤、Step4拖動到適當位置(如1700M左右),其余均不用再選擇,最后點擊Creat, 經過漫長的等待過程啟動U盤就會做好。

 

三、 Ubuntu14.04系統安裝

插入啟動U盤,進入bios啟動選擇項(如惠普電腦開機按F9),出現如下頁面:

如圖所示有兩種啟動方式UEFILegacy。建議選擇Legacy這種啟動方式,個人裝機過程中選擇UEFI系統會裝崩。進入后選擇“install Ubuntu”,隨后按照下圖順序依次按提示選擇:

左邊選擇“中文簡體”,點“繼續”

這里可不必勾選選項,直接點“繼續”(圖中我選了安裝第三方軟件,不是必要的)

如果不需要自己分配內存,可以選第一項,這里我們選“其他選項”來自己手動分配1T的空間,出現如下界面:

點擊“新建分區表”,出現如圖界面:

這時我們便可以看到空閑狀態的1T硬盤,每次分區首先點擊在空閑的內存空間上,點擊左下方“+”來建立新的分區。本人分區大小為:主分區掛載/60G)、交換空間(25G)、邏輯分區掛載/boot2G)、 /usr300G)、/home(剩下內存空間大小)。幾個分區的作用:如交換空間相當於windows系統中的虛擬內存;/boot分區系統引導目錄;/usr分區存放用戶的應用程序和文件;/home目錄各用戶各自的文件夾;(值得一提的是ubuntu系統固定的第幾分區就是什么分區,比如第5分區就是交換空間)

以新建主分區為例,首先點擊在“空閑”硬盤上,點擊左下角“+”,在彈出界面里如圖填寫:

點擊確定即可,其他分區類似依次進行填寫,具體填寫如下圖所示:

依次填寫完畢后,點擊在/boot”那列上,點擊右下角“現在安裝”。

按提示點擊“繼續”

隨后按照提示依次選擇位置、語言、用戶名及密碼設置即可,接下來只需等待片刻就會提示安裝成功,拔掉U盤,重啟計算機。

一直等待直至提示安裝成功,重啟計算機,如果安裝過程中提示安裝程序崩潰(如下圖),請不要灰心,重新按步驟再安裝,一般都會成功的,這是Ubuntu系統不夠穩定引起的,我也遇到了幾次。

如果安裝成功,會提示如下界面:

 

四、 上網環境配置

有線情況下配置網絡比較容易,可以自行百度參考網上教程。無線情況下,需要根據無線網卡的型號下載安裝相應驅動程序。以Tenda U12無線U口網卡為例,將驅動程序zip安裝包拷至/home“用戶名”后,Ctrl+Alt+T快捷鍵打開終端,輸入“ls”命令查看當前目錄內容,輸入“unzip zip文件”,然后cdinstall.sh腳本的位置(可右鍵查看該文件屬性復制其位置),敲入命令sudo sh install.sh,輸入用戶密碼,等待片刻,驅動程序安裝完畢,此時便可插入網卡,連接無線網絡。本人無線網卡驅動程序網盤鏈接:https://pan.baidu.com/s/1dGgOf5J 密碼:b0b4

 

五、 NVIDIA驅動的安裝

看到有些教程里先裝Cuda后裝NVIDIA驅動,原因在於安裝Cudarunfile版)過程中會有一步提示是否要安裝顯卡驅動,而Cudadeb包)可能在不提示的情況下自動安裝了驅動,兩者所安裝的驅動版本可能不是最匹配的。因此個人建議,先在NVIDIA官網上下載推薦的驅動程序(.run.deb文件)。

官網地址:http://www.nvidia.com/Download/index.aspx,官網選擇頁面如圖所示(中英文皆可,無影響)。以本人安裝步驟為例,下載好Nvidia GeForce GT 705(官方推薦下載下來的是.run文件,我之前下載的Quadro的驅動也支持該顯卡,故沿用了之前下載好的Quadro驅動)、Tesla K40(官方推薦下載下來的是.deb文件)的顯卡驅動后,都拷至Ubuntu系統/home“用戶名”目錄下。

本文顯卡驅動網盤鏈接:https://pan.baidu.com/s/1bqMPB11 密碼:ulpw

安裝顯卡驅動步驟如下:

(1) 卸載原有驅動 sudo apt-get remove –purge nvidia-* 其中(-purge)似乎不需要,會提示命令有誤。如果之前沒有裝過NVIDIA驅動,這步可以不需要,當然,前面提到過,如果先安裝Cuda並且在安裝Cuda過程中選擇安裝了不匹配的顯卡驅動,這里就需要執行這個命令刪掉之前的NVIDIA驅動了。

(2) 禁用Ubuntu系統自帶的通用顯卡驅動nouveau

sudo  gedit  /etc/modprobe.d/blacklist.conf輸入密碼后,該命令會用gedit工具打開一個配置文本文件,類似於window里的txt文件,在該文件的最后添加一行:blacklist nouveau后保存退出。然后終端敲入命令 sudo  update-initramfs  -u  

(3) 重啟電腦,打開終端敲入命令 lsmod  |  grep  nouveau 若無輸出表示該驅動禁用成功。

(4) 開機后,Ctrl+alt+F1進入tty1,按提示輸入用戶名(login)、密碼(password)后,敲入命令sudo service lightdm stop,顯示lightdm stop/waiting字樣代表禁用X服務器成功。

(5) 安裝NVIDIA顯卡驅動,若是deb包敲入命令 dpkg  -i  “.deb文件名”;若是run文件敲入命令sudo  sh  .run文件名”。按照提示(默認選擇)進行安裝,如continue、ok、no、ok之類的,等待片刻即可安裝成功。

備注:后來有次我在另一台機器上按本博客再安裝時,裝完nvidia驅動就出現了循環登錄問題,卸載掉驅動就正常,故當時采取了以下命令安裝,據說可以避免循環登錄。

 

(6) 敲入命令sudo  service  lightdm  start 打開X服務器后,重啟電腦。

(7) 進入終端用以下三個命令均可驗證顯卡驅動是否安裝成功,最后一個命令需要根據提示安裝glxinfo程序:sudo nvidia-smi(顯示GPU設備表)、cat  /proc/driver/nvidia/version(顯示出用於顯示的GPU驅動程序版本號、也就是那塊接了顯示線的獨顯的驅動程序版本號)、glxinfo  |  grep rendering(顯示yes)。

 

六、 Cuda8.0環境安裝與配置

推薦去官網下載Cuda8.0runfile文件(.run文件)安裝,這樣可以在安裝過程中選擇不再安裝顯卡驅動(否則安裝.deb文件會自動又安裝了不匹配的顯卡驅動),以及在彈出xorg.conf時選擇NO

Cuda官網地址:https://developer.nvidia.com/cuda-downloads

本文Cuda8.0網盤鏈接:https://pan.baidu.com/s/1diWdKM 密碼:fppp

安裝Cuda8.0步驟如下:

1)將下載好的.run文件拷至/home“用戶名”目錄下,在終端中敲入命令sudo sh Cuda的文件名 –override     override前是兩個-

2然后就進入安裝過程,開始都是End User License Agreement(類似於Windows系統安裝程序時的一些條款文件),可以CTRL +C 跳過,然后選擇accept,下面就是安裝的交互界面,開始的Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 367.48?如果先裝官網推薦的驅動后裝Cuda就一定要選擇n,因為之前已經安裝了官網推薦的最匹配的驅動了。顯示界面大致如下圖,按照下圖YNaccept等作出選擇:

上述有兩處有關什么location的選項,不做任何選擇,直接回車

3配置Cuda環境變量

在終端里按照圖示敲入命令后回車

4)驗證是否安裝成功,有以下兩種方法:

方法一

終端輸入命令nvidia-smi(出現類似於上面裝顯卡驅動時使用該命令的界面,下圖是網上找的,實際我們在敲這句命令時,在GPU那欄里是空的,因為這時並沒有GPU占用)。

方法二

利用上面安裝過程中下載的Cuda樣例程序驗證

首先提前下載好g++

sudo apt-get  update

sudo apt-get  install  g++

然后cd到樣例程序位置

cd   /usr/local/cuda-8.0/samples/1_Utilities/deviceQuery

進入到該目錄下,終端命令行輸入ls

可以看到.cpp文件(需用g++編譯)或者.c文件(需用gcc編譯)

終端命令行輸入

make

sudo  ./deviceQuery

如果顯示一些關於GPU的信息,則說明安裝成功。

 

七、 Cudnn 5.1的安裝及配置

在官網:上下載Cudnn5.1安裝包(.tgz),需要注冊才能下載。

官網:https://developer.nvidia.com/cudnn

本文Cudnn5.1網盤鏈接:https://pan.baidu.com/s/1hteaiYK 密碼:i1u6

Cudnnan安裝包(cudnn-8.0-linux-x64-v5.1.tgz)拷至/home “用戶名”目錄下,打開終端,輸入ls可以看到該文件。解壓該文件,終端命令行輸入: tar xvzf cudnn-8.0-linux-x64-v5.1.tgz

依次在終端內敲入以下三句命令即可安裝成功:(將庫和頭文件復制到本機安裝的cuda的目錄下,如/usr/local/cuda-8.0,如果按照上述安裝步驟就是安裝在此目錄下。)

sudo cp cuda/include/cudnn.h  /usr/local/cuda/include

sudo cp cuda/lib64/libcudnn*  /usr/local/cuda/lib64

sudo chmod a+r  /usr/local/cuda/include/cudnn.h  /usr/local/cuda/lib64/libcudnn*

chmod a+r表示添加文件權限,a表示所有用戶,r表示可讀。

如圖所示安裝步驟,敲命令時注意空格、/”等等。

 

 

 

 

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM