重裝CUDA和cuDNN(目的是裝TensorFlow和pytorch)【個人梳理總結】


寫在前面

  以下是本人在學習過程中,在自己有限的閱讀和學習后總結的重裝/安裝 CUDA、cuDNN、tensorflow和pytorch的框架式(流程式)經驗。
  閱讀完我的總結,你可以了解“到哪兒”,“找什么”,“什么順序”以及“有哪些地方”等收獲,同時也會留下很多自己在閱讀官方文檔和指引中的疑問幫助自己日后精進。
  我不傾向於分享給大家“無腦跟着做”或“保姆級”模式的教程,不利於個人對資料查找能力的成長,也不利於對軟件的理解。
  CUDA、cuDNN以及VScode的安裝與重裝可靠性比較強,在一段時間內具有較大通用價值;末尾的TensorFlow和pytorch安裝說實在的我也沒搞明白,但是也分享了一些途徑供大家當實在沒有其他辦法時嘗試。

一、檢查&下載驅動:

1、看自己的顯卡驅動版本:

  使用組合鍵“Windowskey+R”啟動“cmd”命令行,鍵入“nvidia-smi”回車,查看。
查看顯卡信息

2、在NVIDA官網下載合適的顯卡驅動並安裝:(無需安裝則跳過)

  如果需要重新安裝驅動,記得准備好你的電腦硬件信息。
NVIDIA驅動程序下載
NVIDIA驅動程序下載

二、查找&下載CUDA和cuDNN:

1、檢查顯卡算力:

  執行這個操作的目的我理解有兩個:

  • 你的顯卡是否有GPU支持
  • 你的顯卡算力是否值得裝CUDA和cuDNN

說實在的,如果顯卡算力不是很突出,你又是在學習階段,那就沒必要用GPU。也就是不要迷信GPU。

GPU算力表
GPU算力表

2、下載CUDA:

官網下載CUDA界面
官網下載CUDA界面
  左上紅色表示當前CUDA版本,右下紅色可以進入歷史CUDA版本下載界面;
  上下藍色可以進入CUDA文檔,了解版本支持信息、安裝指引、對VScode的要求等……
  右上橙黃色建議注冊並登入,因為下載cuDNN要求登錄。

目前CUDA 11.6文檔頁面為:
官網CUDA-tookit-release-notes頁面
官網CUDA-tookit-release-notes頁面
根據官方文檔指引下載CUDA 如果你沒有安裝VScode就別着急按裝CUDA

3、下載VScode:

Visual Studio Code官網

(根據CUDA官方文檔的要求下載你需要的VScode——也就是2019或2022的區別)
Visual Studio Code官網頁面
先裝VScode,后裝CUDA

4、下載cuDNN:

官網cuDNN主界面
官網cuDNN下載界面
  紅色進入下載頁面;藍色進入官方文檔;橙黃色 進入登錄頁面。

  下載前如果沒有登陸,點擊紅色□自動跳轉至登錄頁面:
cuDNN下載前登錄界面
  點“登錄”(沒賬號的點“立即加入”完成注冊,類似填寫個調查問卷):
  登錄成功后:
官網cuDNN下載界面
  中間紅色要勾選才能顯示完整下載界面,下方紅色進入歷史版本cuDNN下載界面;
  藍色進入官方文檔,需要仔細閱讀;
cuDNN support matrix
cuDNN Installation guide

(如果是你在疲憊與閱讀官方文檔,或者閱讀后仍然不知道如何正確下載安裝,可以到B站搜一下相關主題,有保姆級視頻教程幫帶一下路)

5、如果你需要重裝CUDA,如何卸載之前的CUDA:

  我目前采用的卸載CUDA方法是參考B站的一個up(舒睿來儀)的視頻(在對CUDA更了解前還得參考):
  在這里感謝UP~!
基於Windows系統實現CUDA的卸載、新CUDA的安裝、多版本CUDA的共存
視頻截圖
視頻目錄

三、下載&安裝TensorFlow和pytorch:

1、查看官方文檔:

  TensorFlow:(這僅僅是經過測試的構建組合)
經過測試的構建組合-gpu
經過測試的構建組合-gpu
  官網白紙黑字寫明是:經過測試的構建配置。至於如何理解,見仁見智。
  但是我認為還是可以認為滿足官方指引要求的就可以安裝對應版本的TensorFlow:
硬件/軟件要求-gpu
硬件/軟件要求-gpu

Pytorch:
官網安裝主頁面
官網安裝主界面
(有時候你會尷尬地發現你的CUDA版本高出推薦頁面版本很多……我也不清楚怎么解決,但可以確定的是,你可通過選定一個可用的pytorch版本反推前面你去要的cuDNN和CUDA版本去安裝)

2、另辟蹊徑:

  飽受折磨的我最終只能想到兩條路:

   - 裝穩定版本的TensorFlow和pytorch,最保險。
   - 找偷懶方法,如果某個管理軟件能夠根據我的配置幫我選一個最合適的那就最好了。

  於是乎……我選了B,我去了:
anaconda官網user-guide之TensorFlow
  看到了一條如下命令:
anaconda-TensorFlow01
anaconda-TensorFlow02

conda create -n tf-gpu-cuda8 tensorflow-gpu cudatoolkit=9.0

  Anaconda網站上居然出現了一條命令直接創建新環境並安裝你所制定CUDA和cuDNN版本后,conda認為最合適的TensorFlow!
  另外,擴展閱讀部分
anaconda-work with GPU
anaconda-work with GPU
  如果你想再冒險一點,可以使用仿照conda create -n tf-gpu-cuda8 tensorflow-gpu cudatoolkit=9.0,寫一條pytorch的安裝命令試一試。

四、結尾:

  其實上文中蘊含許多分支路線可供選擇,仔細閱讀官網文檔的小伙伴可能也發現了CUDA的安裝亦可以通過pip、conda命令行在線安裝,也可以下載對應版本的.whl文件在使用pip本地安裝等等。
  最后提醒,本文也只是個人的一次探索,必然存在許許多多漏洞、錯誤,但我還是希望能夠幫助各位避一些大家都會遇到的坑,至於一些特殊的坑希望大家也通過自己的智慧解決並總結成自己的經驗分享出來~

擴展閱讀:

1. Pytorch以及TensorFlow的GPU版本安裝 - 苟盛 - 博客園


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM