工作站服務器CentOS安裝Nvidia RTX3080/3090 GPU顯卡驅動


系統安裝完成后執行以下操作

 

參考地址:https://www.cnblogs.com/gollong/p/12655424.html

0.下載顯卡驅動 並且保存到你知道的目錄,后面會用到

  英偉達官網(有時需要FQ):https://www.nvidia.cn/drivers/results/168541/#

1.安裝依賴庫
yum -y install gcc
yum -y install epel-release
yum -y install --enablerepo=epel dkms 

 

2.安裝kernel-devel 
  
yum install kernel-devel
yum install kernel-headers

 

 
3.查詢  kernel
  
uname -r

 

 
4.安裝對應版本
yum list | grep kernel-devel

 
5.屏蔽系統自帶的nouveau,檢查nouveau驅動
lsmod | grep nouveau

有輸出代表需要禁用,無輸出代表正常

有輸出的情況需要禁用nouveau驅動
 vim /etc/modprobe.d/blacklist.conf 文件,
 
#nvidia driver
blacklist nouveau
options nouveau modeset=0

加入以上內容並保存   {ESC退出  :wq }
 
6. 重建initramfs image步驟 ,備份重建原來的鏡像文件
      mv  /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
 
      dracut /boot/initramfs-$(uname -r).img $(uname -r)
重啟
reboot
重啟之后,界面應該是低分辨率。
 
7.進入文本界面
init 3
安裝NVIDIA驅動
CD 打開到具體文件夾,執行以下命令
./NVIDIA-Linux-x86_64-460.32.03.run --no-opengl-files --kernel-source-path=/usr/src/kernels/3.10.0-1160.2.2.el7.x86_64(改成你的內核版本)
進入圖形界面
init 5
 此時,界面應該正常。
 
8. 檢查驅動情況
nvidia-smi
安裝CUDA
似乎安裝好了驅動,CUDA就安裝好了。

 

 

這些信息對應的含義如下:

  

 

 

  • GPU:GPU編號(第0塊GPU)
  • Name:GPU型號(GeForce RTX 2080 Ti)
  • Persistence-M:持續模式的狀態。開啟持續模式時新GPU啟動時間短,耗能大。(off)
  • Fan:風扇轉速,從0到100%之間變動(33%)
  • Temp:溫度,單位是攝氏度(48攝氏度)
  • Perf:性能狀態。P0表示最大性能,P12表示狀態最小性能,即 GPU 未工作時為P0,達到最大工作限度時為P12(P0未工作)
  • Pwr:Usage/Cap:能耗(69W/250W)

 

 
  • Bus-Id:涉及GPU總線(00000000:02:00.0)
  • Disp.A:Display Active,表示GPU的顯示是否初始化(off)
  • Memory-Usage:顯存使用率(0MiB/11019MiB)
  • Volatile GPU-Util:浮動的GPU利用率(1%)
  • Uncorr. ECC:Error Correcting Code,錯誤檢查與糾正(N/A)
  • Compute M.:compute mode,計算模式(Default)

 

  • Processes:表示每個進程對 GPU 的顯存使用率

nvidia-smi -L

 

列出所有可用的 NVIDIA 設備信息

Training

 

訓練的是YOLOv5的yolov5s模型

 

  • 定義使用的設備 --device 0 (第零號顯卡)

 

  •  不定義使用的設備 發現四張卡都在運作。
  •  

     

顯卡交火


顯卡交火(AMD-ATI的多顯卡技術叫做CrossFire;NVIDIA的多顯卡技術叫SLI) 簡單的說就是:讓兩塊或者多塊顯卡協同工作,是指芯片組支持能提高系統圖形處理能力或者滿足某些特殊需求的多顯卡並行技術。要實現多顯卡技術一般來說需要主板芯片組、顯示芯片以及驅動程序三者的支持。

顯卡交火系統,是基於你的主板主持四路插槽系統的基礎上,你安裝n個一樣型號的顯卡,n個顯卡就可以一起運作達到交火性能作用,比如遠近聞名的四路泰坦。

系統會將要完成的畫面(視頻、動畫、游戲、文本、圖片等的等等)分解成幾部分,分別分配給幾塊顯卡獨立渲染,然后再將渲染的結果交給主卡合成為一幅完整的畫面(結果),輸出給顯示器。由於每塊顯卡只負責渲染畫面的幾分之一(取決於有幾塊顯卡),大大的降低了顯卡的負擔,提高了運算速度,必然大幅度的提升系統整體的圖形運算性能。

一般說來,雙卡互聯的總體性能大約為單卡的1.9倍(兩塊相同的顯卡)。如果幾塊顯卡參數相差較大,比如用GTX950和GTX980互聯,那么GTX980就極大的被浪費了。因此,顯卡之間規格最好相同。

References

  1. GPU狀態監測 nvidia-smi 命令詳解
  2. 主板的多顯卡是怎么工作的?性能會提高嗎?


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM