GIoU


 

 

作者 | ywsun

論文鏈接 | arxiv.org/abs/1902.0963

原文地址 | https://zhuanlan.zhihu.com/p/57863810

 

作者沒有對網絡結構進行改進,反而是從一個特殊的視角來考慮目標檢測的改進點——使用基於IOU的度量來代替傳統回歸的損失。

作者的主要貢獻是:

1.提出了IOU的通用版本——GIOU,作為比較兩個任意形狀的新指標;
2.提供了將GIOU作為二維坐標框對齊時的loss方案;
3.主要在Faster/Mask RCNN與YOLO v3上面進行試驗,證明在two-stage與one-stage上面均表現很好。
 

Bounding box回歸是2D/3D視覺任務總的基礎模塊。目標檢測、實例分割等等 都需要bbox回歸來獲得較為准確地定位。目前來講,想要獲得更好的檢測效果,要么使用重的backbone,要么設計更好的網絡結構。但是這兩種方案都忽略了bbox regression中基於IOU計算度量的L1/L2 loss。

 

IOU的作用:

在anchor機制中,IOU的作用:

(1)確定正負樣本(0.5);

(2)評價預測框和真實框之間的距離。

在回歸的任務中,判斷pre-bbox與gt-bbox離最直接的指標就是IOU,但是所采用的loss函數卻不太適用:兩個框的某一個角之間的距離是固定的,相同的L2-norm值相同,而其IOU值可以是完全不同的。

因此,一個好的局部優化解未必是IOU的局部優化解。如下圖所示:

 

 

 

 IOU的優點:

對於1-IoU作為距離度量,優點:滿足非負性;同一性;對稱性;三角不等性,尺度不敏感(scale-invariant)

 

 IOU的缺點:

使用IOU來指導回歸任務的學習,IOU可以被反向傳播。然而,將IOU作為損失有兩個問題:

(1)無法衡量兩框是相鄰還是甚遠:如果IOU=0,並不能反映出兩個BBOX之間的距離(臨近還是相離很遠),梯度將為0,無法優化;

(2)無法反應相交方式:如果對齊方式不同,但是交叉區域相同的話,其IOU將完全相等

  針對上述IOU兩點問題,作者提出改進方案:GIOU

 

 

假設A為預測框,B為真實框,S是所有框的集合,不管A與B是否相交,C是包含A與B的最小框,C也屬於S集合

 步驟:

  (1)首先計算IoU,A與B的交並比

  (2)再計算C框中沒有A與B的面積,比上C框面積

       (3)IoU減去前面算出的比;得到GIoU

與IOU相似,GIOU也是一種距離度量;對尺度不敏感;GIOU是IOU的下界;GIOU=[-1,1];GIOU不僅僅關注重疊區域,還關注其他的不重合區域。

 

GIoU的作用:

對於相交的IOU可以被反向傳播,即它可以直接用作優化的目標函數。但是非相交的,梯度將會為0,無法優化。

使用GIOU可以避免該問題,將其作為損失函數,可直接優化LGIou函數。步驟下圖:

 

實驗:

作者將YOLO v3、Faster/Mask RCNN作為benchmarks來驗證提出的方法,證明了不論是one-stage還是two-stage,GIOU對於檢測效果都有提升。下圖是在COCO數據集上的實驗結果對比圖:

 

 

 

YOLO v3漲幅比較明顯,這是因為Faster/Mask RCNN中anchors很密集,GIOU發揮的作用的情況不多。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM