Tensorflow-GPU
> TensorFlow 包版本:tensorflow-gpu 1.13.1
環境條件
現有硬件
-
電腦:華碩筆記本,FX50J
-
顯卡:NVIDIA GeForce GTX 950M
現有軟件
-
Windows 10家庭中文版,x64
-
NVIDIA GPU驅動程序(對應顯卡型號,版本號忘了查,但肯定低於410.x,因為在最終更新驅動之前無法使用)
-
Pyhton 3.7.0(anaconda)
硬件要求
此項內容主要參考GPU 支持 | TensorFlow
-
CUDA 計算能力為 3.5 或更高的 NVIDIA GPU卡。參閱支持 CUDA 的 GPU 卡
在該頁面查找對應自己顯卡的型號即可
比如我的顯卡型號為 NVIDIA GeForce GTX 950M,則點開“CUDA-Enabled GeForce Products”欄,在右側“GeForce Notebook Products”欄可以查到GPU Compute Cabability GeForce GTX 950M 5.0 因此是硬件適配的
查看顯卡及其驅動版本的方法推薦三種:
-
桌面右鍵點擊“此電腦”-“屬性”,在屬性面板左側點擊“設備管理器”,打開下面的“顯示適配器”條目,即可看到顯卡型號,如下圖。右擊“NVIDIA [...]”,點擊“屬性”,選擇“驅動程序”選項卡,即可看到驅動型號
-
在桌面空白處點擊右鍵,選擇“NVIDIA 控制面板”,在主頁面即可看到顯卡型號和驅動版本。點擊“幫助”菜單,選擇“系統信息”可以看到更詳細的內容
-
下載“CPU-Z”軟件,打開后選擇“Graphics”選項卡,點擊第一個下拉菜單欄即可看到顯卡信息
軟件要求
此項內容主要參考GPU 支持 | TensorFlow
注意,此項一定要按照 TensorFlow 的要求,分別查看相應軟件版本是否匹配,或下載安裝對應的軟件版本,切勿僥幸。博主在這一項吃了大虧,浪費了很多時間
以下內容僅限於寫作本文時(2019.04.21),實際要求請參見上述網頁
-
NVIDIA® GPU 驅動程序 - CUDA 10.0 需要 410.x 或更高版本
-
CUDA® 工具包 - TensorFlow 支持 CUDA 10.0(TensorFlow 1.13.0 及更高版本)
-
CUDA 工具包附帶的 CUPTI
這一條博主沒有注意,應該是可選或在 CUDA 中自帶
-
cuDNN SDK(7.4.1 及更高版本)
這一條主要根據 CUDA 的版本來確定cuDNN的版本
-
(可選)TensorRT 5.0,可縮短在某些模型上進行推斷的延遲並提高吞吐量
如官方文檔所述,此項明確是“可選”的,故博主並未關注
步驟
0.Visual studio
- 這一條是看其他教程提到的,因為之前安裝過 VS 2017,所以沒有遇到這方面的問題,也就沒有關注
1.下載安裝顯卡驅動
-
注意:一定要檢查顯卡驅動的版本,不滿足要求是真的用不了……博主最后就是卡在了這個地方,灰溜溜去下了顯卡型號對應的最新版本的驅動
-
驅動下載網址為:Download Drivers | NVIDIA
-
在網頁的如下區域,選擇對應的選項,搜索對應的驅動然后下載安裝即可。
2.下載對應版本 CUDA
-
注意:一定要下載安裝你使用的版本 TensorFlow 支持的 CUDA 版本,比如博主用的當前最新版 tensorflow 1.13.1,則必須使用 CUDA 10.0
建議不要使用 TensorFlow 的測試版 alpha,可能存在模塊、屬性的差異
-
建議默認安裝路徑
-
一開始沒有注意官方文檔對 CUDA版本的要求TensorFlow 支持 CUDA 10.0,以為是“支持 CUDA 10.0 及以上版本”,所以下載安裝的是 CUDA 10.1,結果無法使用(抱歉沒有保存報錯信息)。表現為在 Python 中無法導入tensorflow
-
此外,如果先安裝了 10.1,然后安裝了 10.0,一定記得卸載 10.1 相關的內容,否則會默認啟動 10.1,依然報錯。(其他情況以此類推)
-
若版本不對應,可能會報錯如下(錯誤信息來自stake overflow 某一類似問題):
ImportError: DLL load failed: The specified module could not be found.
ImportError: DLL load failed: 找不到指定模塊
或
Failed to load the native TensorFlow runtime.
See https://www.tensorflow.org/install/install_sources#common_installation_probl ems
for some common reasons and solutions. Include the entire stack trace above this error message when asking for help.
3.安裝配置 cuDNN
-
按照 CUDA 的版本,下載對應版本的 cuDNN
-
將下載的 cuDNN 解壓后,其中文件分別復制到
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0
的對應文件夾下,如(此處參考Installing Tensorflow with CUDA, cuDNN and GPU support on Windows 10 | Medium)
原文件 | 復制到 | 目標文件 |
---|---|---|
<安裝路徑>\cudnn-9.0-windows10-x64-v7.5.0.56\cuda\bin\cudnn64_7.dll | -> | C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\bin\ |
<安裝路徑>\cudnn-9.0-windows10-x64-v7.5.0.56\cuda\ include\cudnn.h | -> | C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\include\ |
<安裝路徑>\cudnn-9.0-windows10-x64-v7.5.0.56\cuda\lib\x64\cudnn.lib | -> | C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\lib\x64\ |
- 注意檢查環境變量是否添加正確,確保已添加如下兩個路徑:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\libnvvp
4.安裝 TensorFlow GPU 支持版本
- 命令行運行
pip install tensorflow-gpu
即可
-
安裝 TensorFlow 的過程不再贅述
-
祝大家安裝順利