nvidia-smi
命令, 可以顯示NVIDIA顯卡基本信息和相關進程占用顯存情況。
參數說明:
(1)GPU信息參數:
參數名稱 | 參數說明 |
---|---|
GPU | GPU 編號 |
Name | GPU 型號 |
Persistence-M | 持續模式的狀態。持續模式雖然耗能大,但是在新的GPU應用啟動時,花費的時間更少,這里顯示的是off的狀態 |
Fan | 風扇轉速,在 [0%~100%] 區間內 |
Temp | 溫度,單位是 ℃ |
Perf | 性能狀態,在[P12~P0],P0表示最大性能,P12表示狀態最小性能 |
Pwr:Usage/Cap | 能耗 |
Memory Usage | 顯存使用率 |
Bus-Id | 涉及GPU總線的東西,domain: bus:device.function |
Disp.A | Display Active,表示GPU的顯示是否初始化 |
Volatile GPU-Util | 浮動的GPU利用率 |
Uncorr. ECC | Error Correcting Code,錯誤檢查與糾正 |
(2)下面相關進程信息參數說明:
參數名稱 | 參數說明 |
---|---|
GPU | 進程使用顯卡 ID |
PID | 進程id |
Type | |
Process name | 進程名字 |
GPU Memory Usage | GPU顯存使用情況 |
(2)nvidia-smi -L 命令
nvidia-smi -L
命令, 可以列出所有NVIDIA顯卡相關型號信息
============
顯存占用和GPU占用是兩個不一樣的東西,顯卡是由GPU和顯存等組成的,顯存和GPU的關系有點類似於內存和CPU的關系。我跑caffe代碼的時候顯存占得少,GPU占得多,師弟跑TensorFlow代碼的時候,顯存占得多,GPU占得少。