GIoU - 碼上歡樂

相關內容簡體繁體

GIoU

本文轉載自查看原文 2019-08-14 15:16 592

作者 | ywsun

論文鏈接 | arxiv.org/abs/1902.0963

原文地址 | https://zhuanlan.zhihu.com/p/57863810

作者沒有對網絡結構進行改進，反而是從一個特殊的視角來考慮目標檢測的改進點——使用基於IOU的度量來代替傳統回歸的損失。

作者的主要貢獻是：

1.提出了IOU的通用版本——GIOU，作為比較兩個任意形狀的新指標；
2.提供了將GIOU作為二維坐標框對齊時的loss方案；
3.主要在Faster/Mask RCNN與YOLO v3上面進行試驗，證明在two-stage與one-stage上面均表現很好。

Bounding box回歸是2D/3D視覺任務總的基礎模塊。目標檢測、實例分割等等都需要bbox回歸來獲得較為准確地定位。目前來講，想要獲得更好的檢測效果，要么使用重的backbone，要么設計更好的網絡結構。但是這兩種方案都忽略了bbox regression中基於IOU計算度量的L1/L2 loss。

IOU的作用：

在anchor機制中，IOU的作用：

（1）確定正負樣本（0.5）；

（2）評價預測框和真實框之間的距離。

在回歸的任務中，判斷pre-bbox與gt-bbox離最直接的指標就是IOU，但是所采用的loss函數卻不太適用：兩個框的某一個角之間的距離是固定的，相同的L2-norm值相同，而其IOU值可以是完全不同的。

因此，一個好的局部優化解未必是IOU的局部優化解。如下圖所示：

IOU的優點：

對於1-IoU作為距離度量，優點：滿足非負性；同一性；對稱性；三角不等性，對尺度不敏感（scale-invariant）

IOU的缺點：

使用IOU來指導回歸任務的學習，IOU可以被反向傳播。然而，將IOU作為損失有兩個問題：

（1）無法衡量兩框是相鄰還是甚遠：如果IOU=0，並不能反映出兩個BBOX之間的距離（臨近還是相離很遠），梯度將為0，無法優化；

（2）無法反應相交方式：如果對齊方式不同，但是交叉區域相同的話，其IOU將完全相等

針對上述IOU兩點問題，作者提出改進方案：GIOU。

假設A為預測框，B為真實框，S是所有框的集合，不管A與B是否相交，C是包含A與B的最小框，C也屬於S集合

步驟：

　　（1）首先計算IoU，A與B的交並比

　　（2）再計算C框中沒有A與B的面積，比上C框面積

（3）IoU減去前面算出的比；得到GIoU

與IOU相似，GIOU也是一種距離度量；對尺度不敏感；GIOU是IOU的下界；GIOU=[-1,1]；GIOU不僅僅關注重疊區域，還關注其他的不重合區域。

GIoU的作用：

對於相交的IOU可以被反向傳播，即它可以直接用作優化的目標函數。但是非相交的，梯度將會為0，無法優化。

使用GIOU可以避免該問題，將其作為損失函數，可直接優化LGIou函數。步驟下圖：

實驗：

作者將YOLO v3、Faster/Mask RCNN作為benchmarks來驗證提出的方法，證明了不論是one-stage還是two-stage，GIOU對於檢測效果都有提升。下圖是在COCO數據集上的實驗結果對比圖：

YOLO v3漲幅比較明顯，這是因為Faster/Mask RCNN中anchors很密集，GIOU發揮的作用的情況不多。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 《論文翻譯》 GIOU GIOU 相比於IOU的好處 AI大視覺（十五） | 損失函數進化史：MSE、IOU、GIOU、DIOU、CIOU、EIOU 目標檢測--IoU，GIoU，DIoU和CIoU三種目標檢測loss 交叉熵、Focal loss、L1，L2，smooth L1損失函數、IOU Loss、GIOU、DIOU和CIOU

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM