CentOS7.3安裝NVIDIA-1080ti驅動、cuda、cudnn、TensorFlow


本文為作者原創,轉載請注明出處(http://www.cnblogs.com/mar-q/)by 負贔屓

 

  Ubuntu非要換centOS。。。好吧。。。

  看了很多是通過ELRepo源安裝驅動,不過我沒有成功,只是通過它的步驟檢測了顯卡驅動型號。
0、安裝gcc
yum -y install gcc-c++
  此處是重點:如果有之前的NVIDIA驅動請先卸載,而且,要先裝cuda再裝驅動。。。你也可以按照我的步驟來,最后再重裝一次驅動。
 
1、檢測顯卡驅動及型號
  ##添加ELPepo源
$ sudo rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
$ sudo rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm
  
  ##安裝NVIDIA驅動檢測
$ sudo yum install nvidia-detect
$ nvidia-detect -v
  兩塊顯卡驅動都是384.59
  登錄NVIDIA官網 http://www.geforce.cn/drivers設置驅動檢索條件(注意盡量設置語言英文):
  
  檢索結果出現384.59,點擊下載獲取下載鏈接 http://us.download.nvidia.com/XFree86/Linux-x86_64/384.59/NVIDIA-Linux-x86_64-384.59.run
  ssh到服務器,下載驅動:
$ cd ~/downloads
$ wget -r -np -nd http://us.download.nvidia.com/XFree86/Linux-x86_64/384.59/NVIDIA-Linux-x86_64-384.59.run
  可能需要sudo權限,建議通過su root直接到root賬戶下執行安裝。安裝過程中選擇“Accept”,並且會詢問是否要配置啟動參數,選擇“yes”。
 
2、顯卡沖突
  因為NVIDIA驅動會和系統自帶nouveau驅動沖突,執行命令查看該驅動狀態:
$ lsmod | grep nouveau
     
  修改/etc/modprobe.d/blacklist.conf 文件,以阻止 nouveau 模塊的加載,如果系統沒有該文件需要新建一個,這里使用root權限,普通用戶無法再在/etc內生成.conf文件。
$ su root
# echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist.conf
 
3、 重新建立initramfs image文件
# mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
# dracut /boot/initramfs-$(uname -r).img $(uname -r)
 
4、進入NVIDIA目錄執行安裝(建議推遲到cuda安裝后再裝驅動)
$ chmod +x NVIDIA-Linux-x86_64-384.59.run
$ sh NVIDIA-Linux-x86_64-384.59.run
   如果安裝完成,可以運行命令查看顯卡狀態
$ nvidia-smi

 

5、安裝cuda
  官網下載cuda-rpm包 https://developer.nvidia.com/cuda-downloads,一定要對應自己的版本。
$ sudo rpm -i cuda-repo-rhel7-8-0-local-ga2-8.0.61-1.x86_64.rpm
$ sudo yum clean all
$ sudo yum install cuda
  報錯了:
Error: Package: 1:nvidia-kmod-375.26-2.el7.x86_64 (cuda-8-0-local-ga2)
           Requires: dkms
 You could try using --skip-broken to work around the problem
 You could try running: rpm -Va --nofiles --nodigest
  缺少2個包,裝第一個:
sudo vim /etc/yum.repos.d/linuxtech.testing.repo
  輸入:
[linuxtech-testing]
name=LinuxTECH Testing
baseurl=http://pkgrepo.linuxtech.net/el6/testing/
enabled=0
gpgcheck=1
gpgkey=http://pkgrepo.linuxtech.net/el6/release/RPM-GPG-KEY-LinuxTECH.NET
sudo yum --enablerepo=linuxtech-testing install libvdpau
  第二個:
yum -y install epel-release
yum -y install --enablerepo=epel dkms
  OK,再次執行install安裝cuda
  。。。發現驅動沒了。。。只好重新安裝,看樣子要先裝cuda再裝NVIDIA驅動,只好再裝一波驅動。
 
6、測試cuda
cd /usr/local/cuda-8.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
  
  安裝成功
 
7、cuda添加到bashprofile中
vim .bashprofile
PATH=$PATH:$HOME/bin:/usr/local/cuda/bin
LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64/
CUDA_HOME=/usr/local/cuda
export PATH
export LD_LIBRARY_PATH
export CUDA_HOME
  查看nvcc版本號
nvcc -V
 
8、安裝cudnn
  cudnn官網需要注冊無法wget,所以在Windows下載然后通過ssh傳過去,為什么不用U盤或者共享文件夾?因為我在家。。。服務器剛配置。。。不嫌麻煩用xshell插件也可以。這里安裝了一個Windows下ssh窗口傳輸文件的工具:
yum install lrzsz
  運行命令為rz,不用scp了,很方便。
  
  解壓cudnn到cuda的安裝目錄
tar -xvf cudnn-8.0-linux-x64-v6.0.tgz -C /usr/local
   抱歉,公司小伙說7.5版本用不了,他去官網注冊下了個cudnn-8.0-linux-x64-v6.0。
 
9、安裝TensorFlow
  如果沒有pip請安裝pip,記得修改一下pip的源,否則速度很慢
yum install python-pip
pip install --upgrade pip
  安裝TensorFlow-gpu版本
pip install --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.3.0-cp27-none-linux_x86_64.whl 
  測試:
  
 
成功。over。
 
 
參考:
此外,建議參考TensorFlow官網,在虛擬環境下安裝。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM