Centos安裝Nvidia驅動、Cuda、Cudnn、TF2.0


Centos安裝Nvidia驅動、Cuda、Cudnn、TF2.0

1、安裝Nvidia驅動

本人的服務器上以前安裝好了Nvidia驅動,此次是在原有基礎上進行操作的,相當於更新驅動。

若是從頭開始安裝需要參考這個教程:https://blog.csdn.net/xueshengke/article/details/78134991


如果是進行更新,需要先卸載之前的版本。

sudo ./NVIDIA-Linux-x86-310.19.run --uninstall

首先需要下載號對應版本的驅動:
https://www.geforce.cn/drivers
在上面這個網站下載好驅動后,在進行下一步

接下來將文檔發送遠程服務器上,可以使用Xftp發送到指定目錄(可以隨便指定)。

切換到驅動文件所在目錄再輸入如下指令進行安裝:

chmod +x NVIDIA-Linux-x86_64-440.31.run
./NVIDIA-Linux-x86_64-440.31.run

然后等待讀取進度。

本人在安裝的過程中遇到了如下錯誤:

unable to find the kernel source tree for current running kernel

出現這個錯誤的原因在於:當前運行的linux kernel版本與kernel-devel和kernel-headers的版本不一致。需要通過更新使其一致。
這個錯誤可以參考:https://blog.csdn.net/haixwang/article/details/90408538

上述博客中提到的網站可能找不到所需的kernel-devel和kernel-headers版本。可以從下面這個網站中尋找:http://rpm.pbone.net/

解決這個問題后就可以順利進行安裝了。

關於安裝選項:

dkms 安裝最好 選yes
32位兼容 安裝最好 選yes
x-org 最好別安,選no,有的電腦可能導致登錄界面黑屏

安裝完后輸入指令進行驗證:nvidia-smi

2、安裝Cuda

安裝Cuda推薦使用conda進行安裝。
輸入如下指令即可進行安裝:

conda install cudatoolkit=10.0
conda install cudnn=7.6

注意:在tensorflow2.0中暫時不支持(cuda10.1--2019.11.6測試)。所以需要安裝cuda10.0。
若使用cuda10.1則會報錯。

Cannot dlopen some GPU libraries. Please make sure the missing libraries mentioned above are installed properly if you would like to use GPU. Follow the guide at https://www.tensorflow.org/install/gpu for how to download and setup the required libraries for your platform.

3、安裝TF2.0

使用conda安裝CPU版本。

conda install tensorflow=2.0

TF2.0 GPU版本使用conda安裝會報錯,需要使用pip命令來安裝。

pip install tensorflow-gpu

安裝完成后,需要進行測試。輸入如下指令:

python

先輸入以上指令進入python解釋器,在輸入下面的指令。

from __future__ import absolute_import, division, print_function, unicode_literals

import tensorflow as tf
print("Num GPUs Available: ", len(tf.config.experimental.list_physical_devices('GPU')))

若是結果等於0,則代表沒安裝好GPU版本。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM