最近准備學習機器學習和深度學習,所以入坑Tensorflow,之前一直使用的是Anaconda3的cpu版本的Tensorflow,但是這次作死一直想用GPU版本的,主要是不想浪費我的1080ti,但是沒想到讓我走上了一條心酸的魔鬼之路。
最開始是想在Vwmare+Ubuntu16.04+Tensorflow+CUDA,但是倒騰了一晚上,均失敗告終,總結經驗大概是虛擬機沒辦法調用本地的物理顯卡,所以我放棄了,真的心累,耽誤時間不說,還心神俱疲。
虛擬環境搭建失敗之后,我就准備在本地win10搭建GPU環境,最開始是 win10 + Tensorflow-GPU 1.12.0 + CUDA 10 + Python 3.6.7,但是我裝了很久沒成功,查詢Tensorflow官方文檔之后,得知1.12和CUDA10截至目前2018-11-15日不相匹配(也不排除我裝不來),具體的報錯可以參考:https://tensorflow.google.cn/install/errors
我當時就是遇到了:
ImportError: DLL load failed: The specified module could not be found.
遇到這個錯誤是因為我沒有正確安裝 visual studio Integration ,關於 visual studio Integration failed 的問題我建議
在windows安全啟動的模式下刪除已經安裝的所有Nivida 相關文件,包括驅動和CUDA 然后重新安裝CUDA(安裝CUDA會順帶安裝驅動)
環境變量的設置參考:https://tensorflow.google.cn/install/gpu
我將CUDA10.0換成9.0(不是9.2)之后,再卸載vs C++ 2017 然后安裝CUDA9.0之后就成功安裝。
安裝的順序是 CUDA -> tensorflow-GPU -> cudnn。具體的詳細步驟可以參考其他博文。遇到 vs問題就卸載重裝。可以按照我這個版本來安裝。
