一、安装环境
Win10
RTX 3060 Laptop 笔记本(台式也一样)
二、安装CUDA与CUDNN
1.安装新版的nvidia图形驱动程序
2.拥有C/C++编译环境
3.查看显卡对应的CUDA版本
命令行中输入nvidia-smi:
得到Driver Version
根据Driver Version去下面的网站找到对应CUDA版本:
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
4.安装对应CUDA https://developer.nvidia.com/cuda-toolkit-archive
目前30系为1.4
5.安装对应CUDNN https://developer.nvidia.com/rdp/cudnn-archive
目前cuda1.4对应cudnn为8.2.1
将解压后的全部文件复制到CUDA的(默认)安装目录中:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.4(版本号)\
6.进入目录C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.4\extras\demo_suite中,在命令行运行deviceQuery.exe和bandwidthTest.exe,如果运行后显示pass则表示CUDA及CUDNN成功安装。
三、安装python
版本至少3.8
四、安装tensorflow
查看tensorflow和cuda对应关系
https://www.tensorflow.org/install/source_windows
pip install tensorflow
默认下载最新版,要求版本至少2.4,因为新版tensorflow(2.4以上)同时包含cpu和gpu支持。
五、测试
测试代码:
import matplotlib as mpl import numpy as np import sklearn import pandas as pd import tensorflow as tf from tensorflow import keras for module in mpl, np, pd, sklearn, tf, keras: print(module.__name__, module.__version__) gpus = tf.config.experimental.list_physical_devices('GPU') logical_gpus = tf.config.experimental.list_logical_devices('GPU') print(len(gpus), "Physical GPUs,", len(logical_gpus), "Logical GPUs")
正常输出:
如果有cudnn文件缺失报错,说明cudnn和cuda版本不匹配,需要重新下载正确的cudnn版本,再将解压后的全部文件复制到CUDA的安装目录中(见上文)