原文:TX2上yolov3精度和速度优化方向

速度优化的方向: 减少输入图片的尺寸, 但是相应的准确率可能会有所下降 优化darknet工程源代码 去掉一些不必要的运算量或者优化运算过程 剪枝和量化yolov 网络 压缩模型 gt 减枝可以参考tiny yolo的过程 , 量化可能想到的就是定点化可能也需要牺牲精度 darknet gt caffe tensorflow tensorrt 主要是针对GPU这块的计算优化 精度优化的方向: 增加 ...

2018-05-14 19:08 1 8527 推荐指数:

查看详情

YOLOv3

对三层作监督,分别重点检测大中小物体。 如果从未接触过检测算法,一定会对YOLOv3有别于其它CNN的诸多方面深表惊奇。惊奇可能意味着巧妙,也可能意味着不合理或者局限。在YOLOv3身上二者兼备。 Output and loss 需要监督的输出层如下。The shape ...

Sun Mar 15 03:48:00 CST 2020 0 1040
TX2 PCIE SDI

PCIE是用FPGA写的 在TX2上可以把PCIE当作一个从设备(不用管FPGA),给它分配一段物理地址 SDI信号是串行的,PCIE会把SDI数据转为RGB,每次收完一帧数据后PCIE置接收完成位,TX2检测该标志位再去读数据 FPGA接收停止位的值:帧频*60*分钟数,PCIE每转一帧 ...

Thu Aug 22 17:42:00 CST 2019 0 402
Jetson TX2

NVIDIA Jetson TX2作为一个嵌入式平台的深度学习端,具备不错的GPU性能,可以发现TX2的GPU的计算能力是6.2。这意味着TX2对半精度运算有着良好的支持,因此,完全可以在桌面端训练好模型,然后移植到TX2上利用半精度运行进行推理,这样可以达到生产落地的效果。 各种情况的硬件 ...

Sat Oct 26 02:44:00 CST 2019 0 1551
TX2 内核编译

准备工作 版本:jetpack3.1,R28.1,TX2 虚拟机:ubuntu14.04 参考文档、编译工具链、源码下载 编译 主要步骤记载如下: <crossbin>是交叉编译工具的路径,如: outdir是编译生成文件的目标路径。 进入 ...

Tue Mar 19 02:13:00 CST 2019 0 1161
YOLOv3处理图片优化——cuda bilinear resize

YOLOv3中处理一张1080P的图片,resize到输入416*416尺寸,调用内部接口做cpu resize,可能80%~90%的时间耗在图像解码、resize上,对比推理时间耗时严重。尝试用cuda做外部resize。修改下工程用于Ubuntu16.04,1080ti显卡,提供个包其中需要 ...

Wed Apr 01 22:19:00 CST 2020 0 3357
Jetson Nano TX1 TX2 Xavier

The Jetson line of embedded Linux AI and computer vision compute modules and devkits from NVIDIA: ...

Sat Nov 16 23:20:00 CST 2019 0 318
Jetson tx2 串口通信

主要参考了这篇博客:https://blog.csdn.net/zomb1e0117/article/details/85157014 其中需要注意的是最后的时候cutecom端口需要把设备改为:/ ...

Tue Feb 19 17:17:00 CST 2019 0 957
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM