win10家庭中文版CUDA+CUDNN+顯卡GPU使用tensorflow-gpu訓練模型安裝過程(精華帖匯總+重新修改多次復現)


本帖提供操作過程,具體操作網上有好多了,不贅述。紅色字體為后來復現出現的問題以及批注

 題外話:

(1)python 的環境盡量保持干凈,盡量單一,否則容易把自己搞暈,不知道自己后來項目開發的依賴包到底安裝在哪里了。

(2)無論是安裝python2 還是python3,還是anaconda,一定要清楚自己的環境,不要一連裝了好幾個版本,會崩的

(3)查看環境變量,python的環境變量是否都被配置,如何配置,在安裝python時就已經涉及到了,最后采用anaconda虛擬環境安裝時不需要配置

如果實在是需要,我的建議是在anaconda里可以重建多個虛擬環境 ,重建環境,最后一個步驟會介紹。

我測試過三遍,我這個版本是可以走通的。后來利用GTX 1060  6G的環境安裝,也是沒問題的。

環境:

OS:win10

cuda:9.0

cudnn:cudnn-9.0-windows10-x64-v7.4.1.5

GPU: 1050 ti

后來分別用 GTX 1060 6g   以及 GTX 950  選擇這個版本都能運行

 

資源包:https://pan.baidu.com/s/1rI_6zBlSIbs5fMWhydqqvA 

提取碼:2pzm

步驟,最好按照順序來:

一、查看自己的顯卡和驅動類型,下載對應的版本

盜來的這張圖:

粗略的看下版本對應關系:

tensorflow各個版本的CUDA以及Cudnn版本對應關系_Python_MIss-Y的博客-CSDN博客

桌面右鍵找到nVidia圖形顯卡按鈕,這里提一下,我的是:

 

后來我用這個配置也是能運行的,截個圖

附錄,看清楚了:

 

二、安裝CUDA

如果系統原先自帶驅動,我直接覆蓋,並未卸載。靠譜的安裝方法看這里:

注意:會報錯,需要安裝VS2015,而且最好是VS2015 

需要先安裝VS2015:

網上關於VS2015的安裝層出不窮,垃圾的太多了,前前后后我裝了不只五遍,摸索出最好最簡便的方式時就是默認安裝,默認路徑,否則很容易繞暈,

建議首先選擇典型值,然后繼續下去,如果后來配置cuda出現問題,打開控制面板->卸載程序-> 指定vs2015 右擊-> 更改  再重新自定義安裝,否則東西太大了,很多都是沒啥用;

 

 總共裝了這么多東西,有些也可能是真的不需要,如圖:

 

 

 

安裝cuda 9.0

如果已經安裝過cuda 9.2 或者其他的版本,重新安裝cuda 9.0 會出現下面界面,個人直接繼續安裝,選擇默認路徑

 

一般情況下CUDA的安裝會出錯,坑介紹的很詳細了, 最好自定義安裝,VS有一個組件需要單獨安裝:

重點!遵循下面帖子的操作方式,cuda安裝包暫時不要關閉

1. CUDA安裝失敗解決方法 - zzpong的小屋

以及對這個帖子的解釋: 

【軟件安裝】CUDA安裝失敗+win10+VS2015+CUDA8.0+CUDAVisualStudioIntegration找不到 - LeonJin的博客

接着:

 

如果已經安裝過其他的版本,會出現下面:

 

接着,打開控制面板-> 卸載程序,出現圖示沖突的,我就直接卸載,基本上都是后綴帶版本 9.2的。這是后來的截圖

 原先卸載的時候沒注意,多卸載了圖形顯示卡,后來裝上tensorflow-gpu   cuda報錯,用了驅動精靈把缺失的驅動補了回來

 

又從此步重新再跑一遍流程,題外話。

 

我兩次一次配置了CUDA的環境變量,一次沒有配置,都可以運行,里面提到了配置環境變量:

【CUDA】CUDA9.0+VS2017+win10詳細配置_Python_筆尖的博客-CSDN博客

注意,驗證cuda是否安裝成功, 上面帖子提到的deviceQuery.exe 和 bandwidthTest.exe返回的 result 結果必須時 pass  !!

 進入cmd后輸入  nvcc -V  指令不一定正確。

 

三、安裝cudann

安裝cudann的坑不多。

 將解壓后的 cudann 壓縮包直接放在 cuda 9.0 的安裝目錄下就好

 

 放入后:

備注:有人提到需要配置 cudann 的環境變量,我沒有配置,不確定是否系統自動生成,從結果上看,暫時還沒出現影響。

 

四、安裝anaconda

anaconda在安裝的時候自帶python環境的

安裝不贅述了,不是重點了,提一下,最好勾選添加環境變量選項。 

五、安裝tensorflow-gpu

tensorflow-gpu 也是需要安裝自定義python環境,和anaconda的python版本獨立,盡量不要直接在基環境中直接安裝 tensorflow-gpu 版本的。

查看Ancona環境

conda info --envs

 

創建環境,並安裝python版本:

#創建制定python版本的環境名字為tfgpu
conda create -n tfgpu python=3.6

備注:如果環境錯誤,可以直接重新運行命令,然后自動刪掉原先的環境。

 

激活,進入狀態:

activate tfgpu

 

安裝tensorflow-gpu

如果 直接指定安裝,網速真的是太慢了,這里采用清華的鏡像安裝,指定 1.8.0 版本的,根據cuda 以及cudann版本選擇gpu版本,這里可以參閱一開始提到的版本介紹,輸入命令需要參考資料:

pip install --default-timeout=100 --ignore-installed tensorflow-gpu==1.8.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

 

 假如需要卸載:

pip uninstall 指定上述安裝的gpu版本名字

 

#退出虛擬環境
deactivate

參考這個操作流程  TensorFlow在Windows上的CPU版本和GPU版本的安裝指南(親測有效) - 只因有你pi

 

即便最后完全安裝成功,但是在跑模型時跑不了的話,報錯:

Check failed: stream->parent()->GetConvolveAlgorithms(&algorithms) 

 

我的解決方案是卸載tensorflow-gpu的版本,然后安裝同類型其他版本,就不停的試錯額。

 

六、配置jupyter  tensorflow-gpu 環境

cmd進入虛擬環境,也可以在anaconda prompt 進入,安裝 jupyter :

PS: 針對版本較多的情況,如果想默認打開是這個版本,需要加入環境變量,cmd后python才能默認打開的是這個版本。

 

七、驗證安裝環境

整理的帖子基本都是大同小異,看看就懂了:

測試TensorFlow(GPU)是否安裝成功_人工智能_weixin_43522055的博客-CSDN博客

最好進入虛擬環境一行行代碼執行,才能看到效果,我在安裝jupyter后,輸入這些沒有看到后台執行過程。

import tensorflow as tf
hello=tf.constant("hello,world")
sess=tf.Session()
print(sess.run(hello))

 

類似的貼子給大家作為參考,網上操作不全的帖子真是太多了,所以自己才吐血寫了一篇:

安裝教程 篇一:在Window10下安裝Anaconda3 和 GPU版

 

在Windows平台監視英偉達(Nvidia)顯卡性能 - hhy_csdn的博客

tensorflow訓練使用GPU和CPU的不同指定方法 - qq_35559420的博客

windows7下使用GPU訓練tensorflow深度學習模型 - baidu_15113429的博客

keras使用GPU訓練模型 - suiyueruge1314的博客

PS: 先想辦法去查資料,而不是去卸載版本。

報錯圖 1:

如果是下面這個圖,可能是 cudnn 沒裝好:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM