TensorFlow支持GPU配置問題


Tensorflow-GPU

> TensorFlow 包版本:tensorflow-gpu 1.13.1

環境條件

現有硬件

  • 電腦:華碩筆記本,FX50J

  • 顯卡:NVIDIA GeForce GTX 950M

現有軟件

  • Windows 10家庭中文版,x64

  • NVIDIA GPU驅動程序(對應顯卡型號,版本號忘了查,但肯定低於410.x,因為在最終更新驅動之前無法使用)

  • Pyhton 3.7.0(anaconda)

硬件要求

此項內容主要參考GPU 支持 | TensorFlow

  • CUDA 計算能力為 3.5 或更高的 NVIDIA GPU卡。參閱支持 CUDA 的 GPU 卡

    在該頁面查找對應自己顯卡的型號即可
    比如我的顯卡型號為 NVIDIA GeForce GTX 950M,則點開“CUDA-Enabled GeForce Products”欄,在右側“GeForce Notebook Products”欄可以查到

    GPU Compute Cabability
    GeForce GTX 950M 5.0

    因此是硬件適配的

查看顯卡及其驅動版本的方法推薦三種:

  1. 桌面右鍵點擊“此電腦”-“屬性”,在屬性面板左側點擊“設備管理器”,打開下面的“顯示適配器”條目,即可看到顯卡型號,如下圖。右擊“NVIDIA [...]”,點擊“屬性”,選擇“驅動程序”選項卡,即可看到驅動型號

  2. 在桌面空白處點擊右鍵,選擇“NVIDIA 控制面板”,在主頁面即可看到顯卡型號和驅動版本。點擊“幫助”菜單,選擇“系統信息”可以看到更詳細的內容

  3. 下載“CPU-Z”軟件,打開后選擇“Graphics”選項卡,點擊第一個下拉菜單欄即可看到顯卡信息

軟件要求

此項內容主要參考GPU 支持 | TensorFlow
注意,此項一定要按照 TensorFlow 的要求,分別查看相應軟件版本是否匹配,或下載安裝對應的軟件版本,切勿僥幸。博主在這一項吃了大虧,浪費了很多時間
以下內容僅限於寫作本文時(2019.04.21),實際要求請參見上述網頁

  • NVIDIA® GPU 驅動程序 - CUDA 10.0 需要 410.x 或更高版本

  • CUDA® 工具包 - TensorFlow 支持 CUDA 10.0(TensorFlow 1.13.0 及更高版本)

  • CUDA 工具包附帶的 CUPTI

    這一條博主沒有注意,應該是可選或在 CUDA 中自帶

  • cuDNN SDK(7.4.1 及更高版本)

    這一條主要根據 CUDA 的版本來確定cuDNN的版本

  • (可選)TensorRT 5.0,可縮短在某些模型上進行推斷的延遲並提高吞吐量

    如官方文檔所述,此項明確是“可選”的,故博主並未關注

步驟

0.Visual studio

  • 這一條是看其他教程提到的,因為之前安裝過 VS 2017,所以沒有遇到這方面的問題,也就沒有關注

1.下載安裝顯卡驅動

  • 注意:一定要檢查顯卡驅動的版本,不滿足要求是真的用不了……博主最后就是卡在了這個地方,灰溜溜去下了顯卡型號對應的最新版本的驅動

  • 驅動下載網址為:Download Drivers | NVIDIA

  • 在網頁的如下區域,選擇對應的選項,搜索對應的驅動然后下載安裝即可。

2.下載對應版本 CUDA

  • 注意:一定要下載安裝你使用的版本 TensorFlow 支持的 CUDA 版本,比如博主用的當前最新版 tensorflow 1.13.1,則必須使用 CUDA 10.0

    建議不要使用 TensorFlow 的測試版 alpha,可能存在模塊、屬性的差異

  • 建議默認安裝路徑

  • 一開始沒有注意官方文檔對 CUDA版本的要求TensorFlow 支持 CUDA 10.0,以為是“支持 CUDA 10.0 及以上版本”,所以下載安裝的是 CUDA 10.1,結果無法使用(抱歉沒有保存報錯信息)。表現為在 Python 中無法導入tensorflow

  • 此外,如果先安裝了 10.1,然后安裝了 10.0,一定記得卸載 10.1 相關的內容,否則會默認啟動 10.1,依然報錯。(其他情況以此類推)

  • 若版本不對應,可能會報錯如下(錯誤信息來自stake overflow 某一類似問題):

ImportError: DLL load failed: The specified module could not be found.
ImportError: DLL load failed: 找不到指定模塊

Failed to load the native TensorFlow runtime.

See https://www.tensorflow.org/install/install_sources#common_installation_probl ems

for some common reasons and solutions. Include the entire stack trace above this error message when asking for help.

3.安裝配置 cuDNN

  1. 按照 CUDA 的版本,下載對應版本的 cuDNN

  2. 將下載的 cuDNN 解壓后,其中文件分別復制到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0的對應文件夾下,如(此處參考Installing Tensorflow with CUDA, cuDNN and GPU support on Windows 10 | Medium

原文件 復制到 目標文件
<安裝路徑>\cudnn-9.0-windows10-x64-v7.5.0.56\cuda\bin\cudnn64_7.dll -> C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\bin\
<安裝路徑>\cudnn-9.0-windows10-x64-v7.5.0.56\cuda\ include\cudnn.h -> C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\include\
<安裝路徑>\cudnn-9.0-windows10-x64-v7.5.0.56\cuda\lib\x64\cudnn.lib -> C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\lib\x64\
  • 注意檢查環境變量是否添加正確,確保已添加如下兩個路徑:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\libnvvp

4.安裝 TensorFlow GPU 支持版本

  • 命令行運行
pip install tensorflow-gpu

即可

  • 安裝 TensorFlow 的過程不再贅述

  • 祝大家安裝順利


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM