本帖提供操作過程,具體操作網上有好多了,不贅述。紅色字體為后來復現出現的問題以及批注
題外話:
(1)python 的環境盡量保持干凈,盡量單一,否則容易把自己搞暈,不知道自己后來項目開發的依賴包到底安裝在哪里了。
(2)無論是安裝python2 還是python3,還是anaconda,一定要清楚自己的環境,不要一連裝了好幾個版本,會崩的。
(3)查看環境變量,python的環境變量是否都被配置,如何配置,在安裝python時就已經涉及到了,最后采用anaconda虛擬環境安裝時不需要配置。
如果實在是需要,我的建議是在anaconda里可以重建多個虛擬環境 ,重建環境,最后一個步驟會介紹。
我測試過三遍,我這個版本是可以走通的。后來利用GTX 1060 6G的環境安裝,也是沒問題的。
環境:
OS:win10
cuda:9.0
cudnn:cudnn-9.0-windows10-x64-v7.4.1.5
GPU: 1050 ti
后來分別用 GTX 1060 6g 以及 GTX 950 選擇這個版本都能運行
資源包:https://pan.baidu.com/s/1rI_6zBlSIbs5fMWhydqqvA
提取碼:2pzm
步驟,最好按照順序來:
一、查看自己的顯卡和驅動類型,下載對應的版本
盜來的這張圖:
粗略的看下版本對應關系:
tensorflow各個版本的CUDA以及Cudnn版本對應關系_Python_MIss-Y的博客-CSDN博客
桌面右鍵找到nVidia圖形顯卡按鈕,這里提一下,我的是:
后來我用這個配置也是能運行的,截個圖
附錄,看清楚了:
二、安裝CUDA
如果系統原先自帶驅動,我直接覆蓋,並未卸載。靠譜的安裝方法看這里:
注意:會報錯,需要安裝VS2015,而且最好是VS2015
需要先安裝VS2015:
網上關於VS2015的安裝層出不窮,垃圾的太多了,前前后后我裝了不只五遍,摸索出最好最簡便的方式時就是默認安裝,默認路徑,否則很容易繞暈,
建議首先選擇典型值,然后繼續下去,如果后來配置cuda出現問題,打開控制面板->卸載程序-> 指定vs2015 右擊-> 更改 再重新自定義安裝,否則東西太大了,很多都是沒啥用;
總共裝了這么多東西,有些也可能是真的不需要,如圖:
安裝cuda 9.0
如果已經安裝過cuda 9.2 或者其他的版本,重新安裝cuda 9.0 會出現下面界面,個人直接繼續安裝,選擇默認路徑:
一般情況下CUDA的安裝會出錯,坑介紹的很詳細了, 最好自定義安裝,VS有一個組件需要單獨安裝:
重點!遵循下面帖子的操作方式,cuda安裝包暫時不要關閉
以及對這個帖子的解釋:
【軟件安裝】CUDA安裝失敗+win10+VS2015+CUDA8.0+CUDAVisualStudioIntegration找不到 - LeonJin的博客
接着:
如果已經安裝過其他的版本,會出現下面:
接着,打開控制面板-> 卸載程序,出現圖示沖突的,我就直接卸載,基本上都是后綴帶版本 9.2的。這是后來的截圖:
原先卸載的時候沒注意,多卸載了圖形顯示卡,后來裝上tensorflow-gpu cuda報錯,用了驅動精靈把缺失的驅動補了回來
又從此步重新再跑一遍流程,題外話。
我兩次一次配置了CUDA的環境變量,一次沒有配置,都可以運行,里面提到了配置環境變量:
【CUDA】CUDA9.0+VS2017+win10詳細配置_Python_筆尖的博客-CSDN博客
注意,驗證cuda是否安裝成功, 上面帖子提到的deviceQuery.exe 和 bandwidthTest.exe返回的 result 結果必須時 pass !!
進入cmd后輸入 nvcc -V 指令不一定正確。
三、安裝cudann
安裝cudann的坑不多。
將解壓后的 cudann 壓縮包直接放在 cuda 9.0 的安裝目錄下就好
放入后:
備注:有人提到需要配置 cudann 的環境變量,我沒有配置,不確定是否系統自動生成,從結果上看,暫時還沒出現影響。
四、安裝anaconda
anaconda在安裝的時候自帶python環境的
安裝不贅述了,不是重點了,提一下,最好勾選添加環境變量選項。
五、安裝tensorflow-gpu
tensorflow-gpu 也是需要安裝自定義python環境,和anaconda的python版本獨立,盡量不要直接在基環境中直接安裝 tensorflow-gpu 版本的。
查看Ancona環境
conda info --envs
創建環境,並安裝python版本:
#創建制定python版本的環境名字為tfgpu
conda create -n tfgpu python=3.6
備注:如果環境錯誤,可以直接重新運行命令,然后自動刪掉原先的環境。
激活,進入狀態:
activate tfgpu
安裝tensorflow-gpu
如果 直接指定安裝,網速真的是太慢了,這里采用清華的鏡像安裝,指定 1.8.0 版本的,根據cuda 以及cudann版本選擇gpu版本,這里可以參閱一開始提到的版本介紹,輸入命令需要參考資料:
pip install --default-timeout=100 --ignore-installed tensorflow-gpu==1.8.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
假如需要卸載:
pip uninstall 指定上述安裝的gpu版本名字
#退出虛擬環境
deactivate
參考這個操作流程 TensorFlow在Windows上的CPU版本和GPU版本的安裝指南(親測有效) - 只因有你pi
即便最后完全安裝成功,但是在跑模型時跑不了的話,報錯:
Check failed: stream->parent()->GetConvolveAlgorithms(&algorithms)
我的解決方案是卸載tensorflow-gpu的版本,然后安裝同類型其他版本,就不停的試錯額。
六、配置jupyter tensorflow-gpu 環境
cmd進入虛擬環境,也可以在anaconda prompt 進入,安裝 jupyter :
PS: 針對版本較多的情況,如果想默認打開是這個版本,需要加入環境變量,cmd后python才能默認打開的是這個版本。
七、驗證安裝環境
整理的帖子基本都是大同小異,看看就懂了:
測試TensorFlow(GPU)是否安裝成功_人工智能_weixin_43522055的博客-CSDN博客
最好進入虛擬環境一行行代碼執行,才能看到效果,我在安裝jupyter后,輸入這些沒有看到后台執行過程。
import tensorflow as tf hello=tf.constant("hello,world") sess=tf.Session() print(sess.run(hello))
類似的貼子給大家作為參考,網上操作不全的帖子真是太多了,所以自己才吐血寫了一篇:
安裝教程 篇一:在Window10下安裝Anaconda3 和 GPU版
在Windows平台監視英偉達(Nvidia)顯卡性能 - hhy_csdn的博客
tensorflow訓練使用GPU和CPU的不同指定方法 - qq_35559420的博客
windows7下使用GPU訓練tensorflow深度學習模型 - baidu_15113429的博客
keras使用GPU訓練模型 - suiyueruge1314的博客
PS: 先想辦法去查資料,而不是去卸載版本。
報錯圖 1:
如果是下面這個圖,可能是 cudnn 沒裝好: