Tensor RT使用記錄

本文轉載自查看原文 2019-03-20 15:17 1560 深度學習

Tensor RT的介紹在此不做贅述。

自己在服務器上本打算裝Tensor RT來着，不過過程很艱辛，最后發現服務器的cudnn版本偏低了，還需要升級cudnn的版本。故，在自己的電腦上了裝了下Tensor RT，同時給自己的電腦將cudnn的版本從7.4升級到了7.5，並跑通了基本的例程。

下面對於Tensor RT的學習進行介紹。

在英偉達的官網上，有幾個文檔，

第一個是支持的Matrix運算，就是各種已經支持的層，對於不同的開發框架如Caffe、ONNX等，支持的層可能會有不同。

https://developer.download.nvidia.cn/compute/machine-learning/tensorrt/docs/5.1/rc/TensorRT-Support-Matrix-Guide.pdf

第二個安裝的文檔，第三個是版本記錄，第四個是開發手冊，第五個是如何去優化TensorRT的表現，第六個是配套的各種example的使用教程。

現在看的是TensorRT5，幾個文檔中最重要的是開發文檔。

在Windows下，現在是用不了Python API的，所以主要看的是C++的API。C++ API部分主要講的內容有：

1、創建網絡定義（可以自己定義，可以從Caffe、TF、ONNX導入模型）

2、Building An Engine

3、序列化該模型

4、執行前向

5、內存管理

6、Refitting An Engine

其余的部分是：擴展Tnesor RT 用自定義(Custom) layer、混合精度使用。

視頻：https://yq.aliyun.com/video/play/1381?utm_content=m_45632&do=login

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 基於RT1052 Aworks 內存擴容記錄（一）什么是Tensor tensor trans_to_tensor = transforms.ToTensor() 做個記錄深度學習框架Tensor張量的操作使用使用tf.print()打印tensor內容 Surface RT使用手記 linux5.4版本內核如何使用PREEMPT_RT？ RT-Thread 設備驅動I2C淺析及使用 RT-Thread的CPU使用率計算