TensorFlow C++ 初始化 Tensor 內存到GPU 內存

本文轉載自查看原文 2018-11-21 10:56 1214

最近使用TensorFlow C++版本實現神經網絡的部署，我通過GPU 處理得到網絡的輸入值，因此輸入值在GPU內存上保存， TF 輸入tensor 的調用語句為 Tensor inputTensor(DT_FLOAT, TensorShape({ 1,2,3,1 })); 默認構造是將內存放到CPU上的。為了實現GPU 到GPU 的內存拷貝，而不是 GPU 到 Cpu 在從CPU 到GPU（通過PCIE總線內存拷貝耗時高），我們需要將inputTensor 內存初始化到GPU上通過實現下面代碼就可以實現。

#include "tensorflow/core/common_runtime/gpu/gpu_bfc_allocator.h"
#include "tensorflow/core/common_runtime/gpu/gpu_cudamalloc_allocator.h"

tensorflow::GPUBFCAllocator * allocator = new tensorflow::GPUBFCAllocator(0,sizeof(float)* Col_num * tempfftsize);
    //tensorflow::Allocator* allocator = new AllocatorWrapper(0, tempfftsize * Col_num * sizeof(float));
    tensorflow::GPUcudaMallocAllocator *gpu_allocator = new tensorflow::GPUcudaMallocAllocator(gpu_allocator, 0);
    tensorflow::Tensor inputTensor(gpu_allocator,DT_FLOAT, tensorflow::TensorShape({ 1,Col_num,tempfftsize,1 }));
    auto inputTensor_flat = inputTensor.flat<float>();
    cudaMemcpy(&inputTensor_flat(0), d_LogSpec, tempfftsize * Col_num * sizeof(float), cudaMemcpyDeviceToDevice);//d_LogSpec為輸入的GPU內存地址

更詳細的介紹參考 https://github.com/tensorflow/tensorflow/issues/19283

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 C++ 未初始化內存出現 flashback 內存初始化 tensorflow初始化參數內存占滿問題 C/C++變量在內存中的位置以及初始化問題 Linux內存初始化(一) Linux內存初始化(三) 內存布局內存管理 | 內存初始化【轉】 C++類的靜態成員變量一定要初始化（分配內存） C++ 頭文件系列(string)----分析string初始化內存模型 C語言中初始化內存的方法

TensorFlow C++ 初始化 Tensor 內存 到GPU 內存

免責聲明！

TensorFlow C++ 初始化 Tensor 內存到GPU 內存