一、安裝環境
Win10
RTX 3060 Laptop 筆記本(台式也一樣)
二、安裝CUDA與CUDNN
1.安裝新版的nvidia圖形驅動程序
2.擁有C/C++編譯環境
3.查看顯卡對應的CUDA版本
命令行中輸入nvidia-smi:
得到Driver Version
根據Driver Version去下面的網站找到對應CUDA版本:
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
4.安裝對應CUDA https://developer.nvidia.com/cuda-toolkit-archive
目前30系為1.4
5.安裝對應CUDNN https://developer.nvidia.com/rdp/cudnn-archive
目前cuda1.4對應cudnn為8.2.1
將解壓后的全部文件復制到CUDA的(默認)安裝目錄中:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.4(版本號)\
6.進入目錄C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.4\extras\demo_suite中,在命令行運行deviceQuery.exe和bandwidthTest.exe,如果運行后顯示pass則表示CUDA及CUDNN成功安裝。
三、安裝python
版本至少3.8
四、安裝tensorflow
查看tensorflow和cuda對應關系
https://www.tensorflow.org/install/source_windows
pip install tensorflow
默認下載最新版,要求版本至少2.4,因為新版tensorflow(2.4以上)同時包含cpu和gpu支持。
五、測試
測試代碼:
import matplotlib as mpl import numpy as np import sklearn import pandas as pd import tensorflow as tf from tensorflow import keras for module in mpl, np, pd, sklearn, tf, keras: print(module.__name__, module.__version__) gpus = tf.config.experimental.list_physical_devices('GPU') logical_gpus = tf.config.experimental.list_logical_devices('GPU') print(len(gpus), "Physical GPUs,", len(logical_gpus), "Logical GPUs")
正常輸出:
如果有cudnn文件缺失報錯,說明cudnn和cuda版本不匹配,需要重新下載正確的cudnn版本,再將解壓后的全部文件復制到CUDA的安裝目錄中(見上文)