環境
- Windows10
- GeForce GTX 960M
- python 3.7.6
- tensorflow-gpu==2.1.0
- CUDA 10.2
- cuDNN v7.9.4.38 for windows10 CUDA10.1(截至到2020-02-21,cuDNN並未發布CUDA v10.2對應的版本)
安裝Python
從Python官網下載對應的python版本,我這里選擇的是Python 3.7.6。下載完之后就是“下一步”的時間了。
安裝tensorflow-gpu
安裝完python
之后,打開powershell
,執行命令:
pip3 install tensorflow-gpu
執行完成后,GPU版的tensorflow就安裝完成了,CPU版的執行命令pip3 install tensorflow
即可。
安裝CUDA 10.2
注意,下載CUDA和cuDNN時,需要注冊NVIDA賬號。
從這里下載Win10對應的v10.2版CUDA。下載完成后就又到了“下一步”的時間了。
安裝cuDNN
從這里下載,windows10系統對應的cuDNN,解壓下載后的文件,將其中bin
、include
和lib
文件夾復制到安裝了CUDA10.2的路徑中,替換掉原來的目錄,我這里CUDA10.2的安裝目錄是C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2
。
之后需要添加環境變量,將C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin
、C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\include
和C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\lib\x64
添加到系統的環境變量中。
測試
打開ipython
,輸入以下內容:
import tensorflow as tf
tf.test.is_gpu_avaolable()
True
注意,此時會報錯,“cudart64_101.dll not found”,沒關系,找到“cudart64_102.dll”,重命名為“cudart64_101.dll”即可。