安裝 tensorflow 1.1.0；以及安裝其他相似版本tensorflow遇到的問題；tensorflow 1.13.2 cuda-10環境變量配置問題；Tensorflow 指定訓練時如何指定使用的GPU；

本文轉載自查看原文 2019-10-31 10:26 1351 機器學習/ Linux/ TensorFlow

# 安裝 2.7 環境
conda create -n python2.7 python=2.7.17
conda activate python2.7

# 安裝 1.1.0 gpu版本
pip  install tensorflow-gpu==1.1.0

# 配置環境變量
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-8.0/lib64 
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-8.0/lib64:/usr/local/cuda-8.0/extras/CUPTI/lib64

# tensorflow1.13.2 cuda-10 lib庫配置; 因為tensorflow 1.13版本以上要求cuda 10
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:/usr/local/cuda/lib64:/home/v-yaxu/nccl/build/lib

保持更新，更多內容請關注 cnblogs.com/xuyaowen;

常用操作：

tensorboard --logdir=/tmp/tensorflow/mnist/logs/mnist_with_summaries/

參考鏈接：

https://www.cnblogs.com/chay/p/10472993.html

https://blog.csdn.net/weixin_35653315/article/details/71308137

"ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory."?

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64

（解決使用 tensorflow 使用過程中，libcublas 庫，找不到的錯誤）

Tensorflow 指定訓練時使用的GPU：

場景：有一台服務器，服務器上有多塊兒GPU可以供使用，但此時只希望使用第2塊和第4塊GPU，但是我們希望代碼能看到的仍然是有兩塊GPU，分別編號為0,1，這個時候我們可以使用環境變量CUDA_VISIBLE_DEVICES來解決；

import os
os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID" # cuda 模式按照進行gpu的性能進行排序，設置此環境變量，GPU的順序，將按照 pci_bus_id編號來進行設置；gpu順序；這樣在cuda_visble_devices環境變量就可以按照pci編號來進行選擇gpu了；
os.environ["CUDA_VISIBLE_DEVICES"] = "0" # 設置程序環境變量；

或在腳本或者命令行中指定：export CUDA_VISIBLE_DEVICES=0 
CUDA_VISIBLE_DEVICES=1  只有編號為1的GPU對程序是可見的，在代碼中gpu[0]指的就是這塊GPU
CUDA_VISIBLE_DEVICES=0,2,3  只有編號為0,2,3的GPU對程序是可見的，在代碼中gpu[0]指的是第0塊，gpu[1]指的是第2塊，gpu[2]指的是第3塊
CUDA_VISIBLE_DEVICES=2,0,3  只有編號為0,2,3的GPU對程序是可見的，但是在代碼中gpu[0]指的是第2塊，gpu[1]指的是第0塊，gpu[2]指的是第3塊

指定GPU占用顯存：

gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.7) # 確保每個GPU使用的顯存，不超過 0.7
sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))

Tesorflow 默認會占用gpu 所有緩存，設置按需占用GPU緩存方法：

config = tf.ConfigProto()
config.gpu_options.allow_growth = True
session = tf.Session(config=config)

GPU 設置參考鏈接：

https://homepages.uc.edu/~schreihf/uchenry/post/using-gpus/ (gpu設置)

https://www.jianshu.com/p/0816c3a5fa5c

https://www.cnblogs.com/darkknightzh/p/6591923.html

https://www.tensorflow.org/guide/gpu (tensorflow 官方關於gpu使用的說明文檔)

https://github.com/tensorflow/docs/blob/r1.13/site/en/guide/using_gpu.md （官方關於 tf.1.13的gpu使用文檔）

設置參考自網絡，如果失效，請糾正；

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 使用anaconda安裝tensorflow （windows10環境） win10安裝多版本CUDA及切換,Path環境變量超限的問題 Java jdk8環境變量配置 centos7配置jdk8環境變量 ubuntu下配置JDK7環境變量 jdk-1.8環境變量配置 Centos7.5中安裝JDK1.8環境變量配置安裝cuda配置環境變量 WIN 10環境下JDK的安裝和環境配置 windows10環境下安裝深度學習環境anaconda+pytorch+CUDA+cuDDN