Ubuntu系統
$ sudo apt update $ sudo apt upgrade
之后出現顯卡驅動出現故障,nvidia-smi輸出有錯,檢測不到相應的驅動。只好重裝,記錄一下,太多的教程根本就不適用。
系統說明
Distributor ID: Ubuntu
Description: Ubuntu 16.04.6 LTS
Release: 16.04
Codename: xenial
Processor: Intel CoreTM i5-6500 CPU @3.20GHz x 4
Graphics: GeForce GTX 1080/PCIe/SSE2
OS type: 64-bit
剛開始時使用NVIDIA-Linux-x86_64-384.78.run出現了下面的問題
sudo sh ./NVIDIA-Linux-x86_64-384.78.runThe distribution-provided pre-install script failed! Are you sure you want to continue? Continue installation Abort installation
選擇 continue之后又有提示
ERROR: Installation has failed. Please see the file '/var/log/nvidia-installer.log' for details. You may find suggestions on fixing installation problems in the README available on the Linux driver download page at www.nvidia.com. OKERROR: An error occurred while performing the step: "Building kernel modules". See /var/log/nvidia-installer.log for details. OK
總之各種問題頻出,因此試了一下其他方法,如下,竟然可以了,屏幕又恢復到比較正常的分辨率了,說明驅動安裝是成功了。
首先卸載 NVIDIA全家桶
sudo apt remove --purge nvidia*
然后直接
sudo apt install nvidia-384
=======================================================================================================
如果需要重新安裝 CUDA和cuDNN,建議直接參考官網,很多博客教程對我們不一定管用。
我采用的是官網的 .deb文件安裝 CUDA的方式,因為其內置了安裝 nvidia-driver的過程。
一般來講,單獨采用安裝 nvidia-driver的方式+ runfile安裝 CUDA會非常繁瑣而且容易配置失敗,最好還是怎樣簡單怎樣來!
1. 安裝CUDA
我這里使用的是 cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb
根據電腦型號的配置到官網選擇相應的安裝包點擊下載。
安裝步驟如下
$ sudo dpkg -i cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb $ sudo apt-key add /var/cuda-repo-<version>/7fa2af80.pub $ sudo apt-get update $ sudo apt-get install cuda
說明:其中第一步和第二步,只需要進入相應的路徑,比如我把下載好的 deb 文件放在 ~/Downloads 文件夾下,進入文件目錄,然后輸入 sudo dpkg -i cuda 直接 TAB 鍵系統會自動補全后面的文件名,前提是只有一個版本的安裝包。
第二個也是,當我輸入 sudo apt-key add /var/cuda 之后 TAB 鍵直接補全即可。
2. 安裝cuDNN
我這里使用的是 libcudnn7_7.0.5.15-1+cuda9.0_amd64.deb
$ sudo dpkg -i libcudnn7_7.0.5.15-1+cuda9.0_amd64.deb
3. 安裝完畢后,配置環境變量
$ sudo vim ~/.bashrc
在打開的文件末尾寫入
export PATH=/usr/local/cuda-9.0/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH
更新源
$ source ~/.bashrc
然后打開文件
$ sudo vim /etc/ld.so.conf.d/cuda.conf
在文件末尾寫入(如果已經存在內容/usr/local/cuda/lib64,可以先查看一下是否/usr/local/cuda是否鏈接向/usr/local/cuda-9.0,如果是的話就不用再進行下面的步驟了,說明已經配置好了。)
/usr/local/cuda-9.0/lib64
更新
$ sudo ldconfig