IoU-aware Single-stage Object Detector for Accurate Localization

本文轉載自查看原文 2020-02-24 16:11 700 IoU-aware/ Anchor/ FPN/ RetinalNet/ Smooth L1/ Focal Loss/ Binary cross-entropy/ Machine Learning/Computer Vision/ IOU/ GT Box

網絡的結構如下：

采用FPN結構,Backbone是RetinalNet,分成了P3~P7共5個Layer,分別訓練不同尺寸的Box.每個Layer對應的Head有2個分支,包括一個單獨的分支用來預測分類,另一個分支用來預測兩部分,一部分是Box坐標的回歸,另一部分是GT Box和Anchor之間的IOU,這也是這篇論文的主要創新點,Faster RCNN等方法是對Anchor進行分類,與GT Box的IOU高於0.7的是正例,低於0.3的是負例,而這篇論文直接預測GT Box和Anchor之間的IOU.

Loss Function包括3個部分:分類損失,包括正例和負例,采用Focal Loss作為損失函數;回歸損失,采用Smooth L1作為損失函數;IOU由於在0~1之間,采用Binary cross-entropy作為損失函數.

推理時采用分類值和IOU的值的乘積作為預測框的置信度,也就是排序的依據,其中α用來調整兩者的權重.

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 論文閱讀筆記三十九：Accurate Single Stage Detector Using Recurrent Rolling Convolution（RRC CVPR2017）【論文筆記】M2Det: A Single-Shot Object Detector Based on Multi-Level Feature Pyramid Network [實例分割] Single Stage Instance Segmentation — A Review 目標定位（Object localization）目標檢測--SSD: Single Shot MultiBox Detector(2015) 論文閱讀筆記二十九：SSD: Single Shot MultiBox Detector(ECCV2016) 論文筆記之：Active Object Localization with Deep Reinforcement Learning 論文閱讀：BASNet: Boundary-Aware Salient Object Detection Mobile Video Object Detection with Temporally-Aware Feature Maps 【論文學習筆記】百度人臉識別算法 PyramidBox: A Context-assisted Single Shot Face Detector