查看nvidia驅動,報錯
$ nvidia-smi
Failed to initialize NVML: Driver/library version mismatch
排查思路:1.查看顯卡驅動所使用的內核版本
# cat /proc/driver/nvidia/version
NVRM version: NVIDIA UNIX x86_64 Kernel Module 440.100 Fri May 29 08:45:51 UTC 2020
這里顯示nvidia內核驅動版本是440.100。
2.查看服務器的驅動版本
# cat /var/log/dpkg.log | grep nvidia

從畫藍色線條的地方分析,系統版本被升級為450.102.04了。
如此找到原因了,nvidia的內核版本是440.100,而現在服務器的系統版本是450.102.04,兩者不匹配。
解決有兩種方式:1. 先卸載nvidia驅動sudo apt-get purge nvidia* ,而后重新安裝驅動。2. 重啟服務器,nvidia的內核版本會自動匹配升級。
結束。
