顯卡驅動的安裝並不難,比較麻煩的是驅動版本的選擇,而且如果是離線環境的話會有很多依賴包,系統默認安裝是不帶的。本文不討論極端環境,現在介紹一下一般情況下的驅動安裝方法。
1.查看服務器的顯卡版本
lshw -numeric -C display
那我測試的服務器顯卡版本是Tesla V100
2.在官方網站選取合適的驅動下載
如圖:Priduce Type選擇Tesla,Operating system選擇linux 64.多選框反應有點慢,選擇好后需要等幾秒鍾。
選擇完成,點search在下載給出的驅動版本,也可以復制下載地址直接在服務器上wget
3.准備安裝環境
3.1安裝依賴
yum install install -y tar bzip2 make automake gcc gcc-c++ pciutils elfutils-libelf-devel libglvnd-devel iptables firewalld vim bind-utils wget
3.2編輯配置文件
vim /lib/modprobe.d/dist-blacklist.conf
將nvidiafb注釋掉:
#blacklist nvidiafb
添加以下語句:
blacklist nouveau
options nouveau modeset=0
3.3重建initramfs image文件
cp /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)
重建完成后重啟服務器生效,重啟這個步驟一定要做。
3.4重啟后驗證nouveau是否已被禁用
lsmod | grep nouveau
無輸出則說明禁用成功。
4.安裝驅動
chmod +x NVIDIA-Linux-x86_64-440.118.02.run
./NVIDIA-Linux-x86_64-470.103.01.run
下一步下一步注意報錯。
5.驗證
nvidia-smi
6.驅動卸載
找到顯卡驅動.run文件:
sh NVIDIA-Linux-x86_64-460.106.00-k80.run --uninstall
yum remove nvidia-*
rpm -qa |grep -i nvid|sort
yum remove kmod-nvidia-*