使用conda創建一個新的虛擬環境
輸入 conda create -n intelligent-judge python=3.6
創建一個python版本為3.6的名字是intelligent-judge的虛擬環境
查看顯卡信息
輸入lspci | grep -i vga查看顯卡信息
很明顯是NVIDIA Quadro GP100
配置CUDA和CUDNN
本來是要去下載cuda和cudnn的,結果一看,服務器上已經有現成的了
輸入
cat /usr/local/cuda/version.txt,
和
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
可以看到cuda是9.0.176版本的,cudnn是7.5.0版本的
所以對應版本,決定安裝tensorflow gpu-1.70version
在虛擬環境中配置python包
輸入source activate intelligent-judge激活虛擬環境
輸入pip install tensorflow-gpu==1.7.0
安裝成功
從遠程庫中pull下測試文件
運行,出現問題
提示cuda找不到
按照下面這篇文章進行調整
https://blog.csdn.net/qq_34374211/article/details/81018320
成功運行測試文件
運行訓練文件,又出幺蛾子了
查閱官方API
原來是在tensorflow 1.7.0中tf.random.normal應該被替換為tf.random_normal
更改后運行
已經開始愉悅的訓練了