CentOS7.3安裝NVIDIA-1080ti驅動、cuda、cudnn、TensorFlow

本文轉載自查看原文 2017-09-06 01:09 20017 Ubuntu/CentOS/ ML&DL

本文為作者原創，轉載請注明出處（http://www.cnblogs.com/mar-q/）by 負贔屓

　　Ubuntu非要換centOS。。。好吧。。。

　　看了很多是通過ELRepo源安裝驅動，不過我沒有成功，只是通過它的步驟檢測了顯卡驅動型號。

0、安裝gcc

yum -y install gcc-c++

　　此處是重點：如果有之前的NVIDIA驅動請先卸載，而且，要先裝cuda再裝驅動。。。你也可以按照我的步驟來，最后再重裝一次驅動。

1、檢測顯卡驅動及型號

　　##添加ELPepo源

$ sudo rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
$ sudo rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm

　　##安裝NVIDIA驅動檢測

$ sudo yum install nvidia-detect
$ nvidia-detect -v

　　兩塊顯卡驅動都是384.59

　　登錄NVIDIA官網 http://www.geforce.cn/drivers設置驅動檢索條件（注意盡量設置語言英文）：

　　檢索結果出現384.59，點擊下載獲取下載鏈接 http://us.download.nvidia.com/XFree86/Linux-x86_64/384.59/NVIDIA-Linux-x86_64-384.59.run

　　ssh到服務器，下載驅動：

$ cd ~/downloads
$ wget -r -np -nd http://us.download.nvidia.com/XFree86/Linux-x86_64/384.59/NVIDIA-Linux-x86_64-384.59.run

　　可能需要sudo權限，建議通過su root直接到root賬戶下執行安裝。安裝過程中選擇“Accept”，並且會詢問是否要配置啟動參數，選擇“yes”。

2、顯卡沖突

　　因為NVIDIA驅動會和系統自帶nouveau驅動沖突，執行命令查看該驅動狀態：

$ lsmod | grep nouveau

　　修改/etc/modprobe.d/blacklist.conf 文件，以阻止 nouveau 模塊的加載，如果系統沒有該文件需要新建一個，這里使用root權限，普通用戶無法再在/etc內生成.conf文件。

$ su root
# echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist.conf

3、重新建立initramfs image文件

# mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
# dracut /boot/initramfs-$(uname -r).img $(uname -r)

4、進入NVIDIA目錄執行安裝（建議推遲到cuda安裝后再裝驅動）

$ chmod +x NVIDIA-Linux-x86_64-384.59.run
$ sh NVIDIA-Linux-x86_64-384.59.run

　　如果安裝完成，可以運行命令查看顯卡狀態

$ nvidia-smi

5、安裝cuda

　　官網下載cuda-rpm包 https://developer.nvidia.com/cuda-downloads，一定要對應自己的版本。

$ sudo rpm -i cuda-repo-rhel7-8-0-local-ga2-8.0.61-1.x86_64.rpm
$ sudo yum clean all
$ sudo yum install cuda

　　報錯了：

Error: Package: 1:nvidia-kmod-375.26-2.el7.x86_64 (cuda-8-0-local-ga2)

Requires: dkms

You could try using --skip-broken to work around the problem

You could try running: rpm -Va --nofiles --nodigest

　　缺少2個包，裝第一個：

sudo vim /etc/yum.repos.d/linuxtech.testing.repo

　　輸入：

[linuxtech-testing]

name=LinuxTECH Testing

baseurl=http://pkgrepo.linuxtech.net/el6/testing/

enabled=0

gpgcheck=1

gpgkey=http://pkgrepo.linuxtech.net/el6/release/RPM-GPG-KEY-LinuxTECH.NET

sudo yum --enablerepo=linuxtech-testing install libvdpau

　　第二個：

yum -y install epel-release
yum -y install --enablerepo=epel dkms

　　OK，再次執行install安裝cuda

　　。。。發現驅動沒了。。。只好重新安裝，看樣子要先裝cuda再裝NVIDIA驅動，只好再裝一波驅動。

6、測試cuda

cd /usr/local/cuda-8.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

　　安裝成功

7、cuda添加到bashprofile中

vim .bashprofile

PATH=$PATH:$HOME/bin:/usr/local/cuda/bin

LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64/

CUDA_HOME=/usr/local/cuda

export PATH

export LD_LIBRARY_PATH

export CUDA_HOME

　　查看nvcc版本號

nvcc -V

8、安裝cudnn

　　cudnn官網需要注冊無法wget，所以在Windows下載然后通過ssh傳過去，為什么不用U盤或者共享文件夾？因為我在家。。。服務器剛配置。。。不嫌麻煩用xshell插件也可以。這里安裝了一個Windows下ssh窗口傳輸文件的工具：

yum install lrzsz

　　運行命令為rz，不用scp了，很方便。

　　解壓cudnn到cuda的安裝目錄

tar -xvf cudnn-8.0-linux-x64-v6.0.tgz -C /usr/local

　　抱歉，公司小伙說7.5版本用不了，他去官網注冊下了個cudnn-8.0-linux-x64-v6.0。

9、安裝TensorFlow

　　如果沒有pip請安裝pip，記得修改一下pip的源，否則速度很慢

yum install python-pip
pip install --upgrade pip

　　安裝TensorFlow-gpu版本

pip install --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.3.0-cp27-none-linux_x86_64.whl

　　測試：

成功。over。

參考：

http://blog.csdn.net/renhanchi/article/details/73468982

http://www.cnblogs.com/snake553/p/7159376.html

http://www.linuxidc.com/Linux/2017-03/141644.htm

http://blog.csdn.net/wang2008start/article/details/71319970

此外，建議參考TensorFlow官網，在虛擬環境下安裝。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Ubuntu18.04+1080ti配置nvidia driver+cuda10.2+cudnn+pytorch AI模型運維——NVIDIA驅動、cuda、cudnn、nccl安裝 CentOS 7.4 Nvidia GeForce RTX 2080 Ti 顯卡驅動安裝 CentOS7.3安裝Nginx Ubuntu16.04下nvidia驅動+nvidia-docker+cuda9+cudnn7安裝 Ubuntu18.04安裝RTX2080Ti+NVIDIA驅動+CUDA 在CentOS 7.3 中安裝 NVIDIA GT730 顯卡驅動初用Linux, 安裝Ubuntu16.04+NVIDIA387+CUDA8.0+cudnn5.1+TensorFlow1.0.1 Ubuntu16.04安裝cuda10.2 + cuDNN 7.6.5.32 （包含Nvidia驅動） Ubuntu16.04安裝Nvidia顯卡驅動+Cuda8.0+Cudnn6.0