安裝 tensorflow 1.1.0;以及安裝其他相似版本tensorflow遇到的問題;tensorflow 1.13.2 cuda-10環境變量配置問題;Tensorflow 指定訓練時如何指定使用的GPU;


# 安裝 2.7 環境
conda create -n python2.7 python=2.7.17 conda activate python2.7
# 安裝 1.1.0 gpu版本
pip install tensorflow-gpu==1.1.0
# 配置環境變量
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-8.0/lib64
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-8.0/lib64:/usr/local/cuda-8.0/extras/CUPTI/lib64
# tensorflow1.13.2 cuda-10 lib庫配置; 因為tensorflow 1.13版本以上要求cuda 10
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:/usr/local/cuda/lib64:/home/v-yaxu/nccl/build/lib 

保持更新,更多內容請關注 cnblogs.com/xuyaowen; 

常用操作:

tensorboard --logdir=/tmp/tensorflow/mnist/logs/mnist_with_summaries/ 

參考鏈接:

https://www.cnblogs.com/chay/p/10472993.html 

https://blog.csdn.net/weixin_35653315/article/details/71308137 

"ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory."?

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64

(解決使用 tensorflow 使用過程中,libcublas 庫,找不到的錯誤)

Tensorflow 指定訓練時使用的GPU:

場景:有一台服務器,服務器上有多塊兒GPU可以供使用,但此時只希望使用第2塊和第4塊GPU,但是我們希望代碼能看到的仍然是有兩塊GPU,分別編號為0,1,這個時候我們可以使用環境變量CUDA_VISIBLE_DEVICES來解決;

import os
os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID" # cuda 模式按照進行gpu的性能進行排序,設置此環境變量,GPU的順序,將按照 pci_bus_id編號來進行設置;gpu順序;這樣在cuda_visble_devices環境變量就可以按照pci編號來進行選擇gpu了; os.environ[
"CUDA_VISIBLE_DEVICES"] = "0" # 設置程序環境變量;
或在腳本或者命令行中指定:export CUDA_VISIBLE_DEVICES=0 
CUDA_VISIBLE_DEVICES=1 只有編號為1的GPU對程序是可見的,在代碼中gpu[0]指的就是這塊GPU
CUDA_VISIBLE_DEVICES=0,2,3 只有編號為0,2,3的GPU對程序是可見的,在代碼中gpu[0]指的是第0塊,gpu[1]指的是第2塊,gpu[2]指的是第3塊
CUDA_VISIBLE_DEVICES=2,0,3 只有編號為0,2,3的GPU對程序是可見的,但是在代碼中gpu[0]指的是第2塊,gpu[1]指的是第0塊,gpu[2]指的是第3塊

指定GPU占用顯存:

gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.7) # 確保每個GPU使用的顯存,不超過 0.7
sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options)) 

Tesorflow 默認會占用gpu 所有緩存,設置按需占用GPU緩存方法:

config = tf.ConfigProto()
config.gpu_options.allow_growth = True
session = tf.Session(config=config)

GPU 設置參考鏈接:

https://homepages.uc.edu/~schreihf/uchenry/post/using-gpus/ (gpu設置)

https://www.jianshu.com/p/0816c3a5fa5c 

https://www.cnblogs.com/darkknightzh/p/6591923.html 

https://www.tensorflow.org/guide/gpu (tensorflow 官方關於gpu使用的說明文檔)

https://github.com/tensorflow/docs/blob/r1.13/site/en/guide/using_gpu.md (官方關於 tf.1.13的gpu使用文檔)

設置參考自網絡,如果失效,請糾正;


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM