最新更新:2018-03-16 16:07:26
注意這幾點,少填坑:
安裝順序:Python -> Tensorflow -> Nvidia GPU Driver -> CUDA -> CUDNN
其中,可以在安裝完成TensorFlow之后,嘗試在python中import tensorflow,然后看給出的錯誤信息,其中包含所需要的CUDA和CUDNN版本,比如:
ImportError: libcudnn.so.6: cannot open shared object file: No such file or directory
表示需要CUDNN6.0版本,而與其對應的是CUDA8.0,到這一步基本就OK了。
一定要下載對應的CUDA和CUDNN。
Tensorflow不支持CUDA9.0,故請將以下所有涉及9.0的換成8.0即可。
下面的內容僅供參考。
Windows10中,下載CUDA 8.0之后,在安裝的時候選擇自定義安裝,並去掉GEFORCE和驅動,否則會安裝失敗。
安裝完成之后,在python中調用tensorflow發現缺少cudnn6_64.dll,這意味着需要下載cudnn6 for cuda8.0。
下載完了直接將文件放到對應的文件夾中即可。
再次調用tensorflow,成功。
最終成功:
CUDA和CUDNN的測試也通過了,就不放圖了。放一張import tensorflow成功的。
1、下載CUDA 9.0
從官網下載CUDA9.0,注意,如果網速太慢,不能10分鍾之內下載完畢,最好用虛擬主機或者百度網盤離線下載。
我用本機下載嘗試了好幾次,都失敗了,最后用的是Azure上的Ubuntu下載的,接着用/var/www/html分享,此外還有NFS、SSH、FTP等方法,可以在本地共享遠程的ubuntu文件。Azure上的磁盤是托管的,如果刪除了虛擬主機,應該可以直接全部導出磁盤上的文件,不過我沒有試過。
Linux上的常用下載軟件是uget,用uget代理firefox的全部下載鏈接。可以先用uget從官網下載,失敗之后千萬不要重試,讓其hang out,然后再從虛擬主機或者其他的鏈接用uget下載,這時uget會自動續傳。
2、安裝NVIDIA顯卡驅動
這個時候,直接在tty1中操作,請確保有網絡鏈接。
sudo service lightdm stop #關閉圖形界面
黑屏、開機時候的樣子,接着按 ctrl+alt+F1進入tty1,登錄。
我們發現下載的CUDA文件名中有384字樣,這意味着我們需要下載nvidia-384這個驅動。為了避免出現循環登錄、“Low graphical mode”以及不識別各種硬件的問題,我們需要先將默認的若干顯卡驅動添加到一個配置文件中:
sudo apt-get install vim #自帶的vi是屎 cd /etc/modprobe.d/ sudo vim blacklist.conf
並且在最后添加:blacklist nouveau
sudo update-initramfs -u
接着直接安裝nvidia-384
sudo apt-get remove --purge nvidia-* #先卸載已經安裝的驅動 sudo apt-get install nvidia-384 nvidia-xconfig nvidia-settings nvidia-prime
sudo update-initramfs -u
3、安裝CUDA9.0
依然實在tty1中進行,找到下載的CUDA文件,參照官網在下載按鈕下方給出的安裝方法,輸入命令即可。我的是.run文件,因此
sudo sh cuda_9.0_file.run
按空格快速瀏覽協議,accept之后,不用安裝cuda中帶的384驅動,輸入n。接着輸入y或者按回車。
安裝完畢之后,重啟。
sudo reboot
至此,CUDA安裝完畢。新安裝的顯卡驅動對桌面的支持不好,在拖動窗口的時候會有鋸齒。╮(╯▽╰)╭(我自己安裝的時候都是坑。)
安裝Tensorflow-gpu
sudo pip3 install tensorflow-gpu
一定要用sudo,否則白下。
最后放一張