tensorRT 與yolov3_tiny

本文轉載自查看原文 2019-05-12 09:06 1228 深度學習

yolov3-tiny中有下面這些層：

Convolutional

Maxpooling

Leaky-Relu

Linear-Relu(正常的Relu)

Residual Block

Strided Residual Block

Upsample

查看TensorRT支持的網絡層種類：

https://developer.download.nvidia.cn/compute/machine-learning/tensorrt/docs/5.1/rc/TensorRT-Support-Matrix-Guide.pdf

ONNX的格式是都支持上面的層的，只是不清楚Residual Block這種跨連接的層是不是可以直接實現的。

如果采用的是C++ 的API，有下面幾個問題思考：

1、weight格式如何轉換成為ONNX的格式

2、如何讀取圖片，輸入網絡

3、網絡的輸出，轉換為准確度

如果采用的是Python的API，那么直接就會有Yolo-V3的示例。

由於ONNX版本的問題造成了一天進度都很慢，現在已經可以將示例跑通了。

整個過程中遇到的Bug有：

1、ONNX的upsample在1.2.1之后就移除了，開始的時候有python2和python3兩個高版本的ONNX的包，應該將python2的ONNX版本調低，但是將python3的ONNX版本降低了。

2、PIL的圖片讀取速度比Opencv要慢。

3、feature的尺寸是CHW，其中H和W的兩個順序不要顛倒了。

TX2 的刷機過程中遇到的問題有：

1、需要用USB-Mini線連接TX2與電腦，同時還需要將TX2和電腦用網線連接到路由器上，同時要保證路由器是可以上網的。

2、在Nvidia官網上下載的只是一個Ubuntu主機的安裝包，需要將這個安裝包安裝在Ubuntu上，然后在Ubuntu電腦上下載Cuda、Cudnn等包。

3、在TX2上安裝pycuda的時候遇到了問題，其中最后解決的是關於環境變量的問題，，好像是在什么目錄下，建立了一個sh文件，然后將環境變量寫到里面了。改變/etc下面的環境變量是不是需要重啟？

4、在TX2上使用半精度的TensorRT遇到了問題，building engine總是出現問題。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Yolov3-tiny車輛檢測在Yolov5 Yolov4 Yolov3 TensorRT 實現Implementation yolov3及tiny版本的實踐（Windows） yolov2-tiny-voc.cfg 參數解析 YOLOv3使用筆記——TensorRT加速 TensorRT&Sample&Python[yolov3_onnx] 目標檢測之車輛行人（tensorflow版yolov3-tiny）基於vs2013+opencv3.4.2的yolov3-tiny的demo 實現TensorRT加速Pytorch模型的過程（Yolov5為例） TensorRT int8 量化部署 yolov5s 5.0 模型