『計算機視覺』Generalized Intersection over Union: A Metric and A Loss for Bounding BoxRegression


論文地址:Generalized Intersection over Union

一、相關工作

目標檢測精度標准

度量檢測優劣基本基於 IOU,mAP 是典型的基於 IOU 的標准,但是 mAP 僅有一個 threshold,對於過了線的預測框一視同仁,不能進一步衡量其優劣,所以 MS COCO 挑戰賽提出了多 IOU 閾值的綜合 mAP 評價標准(就是同時采用幾個閾值,計算出多個 mAP 綜合打分)。

Bounding box 表示方法和損失函數

YOLO v1 直接回歸 bbox 的位置參數(x,y,h,w),並在(h,w)采用預測平方根的方式回避尺度敏感

RCNN 預測的是相對預先檢測出的候選區的位置偏移,采用 log 空間回避尺度敏感

此時的損失函數以 l2 為主

Faster RCNN 提出 l1 smooth 損失函數,使得學習魯棒性更好

Faster RCNN 提出了 anchor boxes 取代了 RCNN 系列中的候選生成算法,但是過多的 anchor 候選框導致了正負樣本不平衡的問題,其作者進一步提出了 focal loss 進行應對(存疑,一般來說 one stage 法更易受到正負樣本不平衡的困擾,而 two stage 法由於會在候選框階段通過得分和nms篩選過濾掉大量的負樣本,然后在分類回歸階段又固定正負樣本比例,相較 one stage 法情況會好很多)。

二、Generalized Intersection over Union

1、IOU 的優點

  1. 將 1-IOU 作為距離度量,(數學可證的)滿足非負性、同一性、對稱性和三角不等性(non-negativity, identity of indiscernibles, symmetry and triangle inequality
  2. IOU 具有尺度不變性,不受 bbox 於 ground truth 的大小影響

2、IOU 的問題

  1. 只要兩個框不相交,IOU 就為0,這使得它無法衡量兩個框是相鄰還是相距甚遠
  2. IOU 無法反映兩個框相交的方式,解釋如 Figure2 所示:

 3、GIOU 算法介紹

對於同形狀的 A 和 B,C 為相同形狀的最小的可以包含 A、B 的圖形(例如通常 A 和 B 是矩形框,此時 C 也取矩形框),下面公式給出 GIOU 的計算過程:

然后作者給出了 GIOU 的5個特點:

  1. 將 1-GIOU 作為距離度量,其繼承了 IOU 的優良數學特性
  2. GIOU 同樣具有尺度不變性
  3. GIOU 永遠小於 IOU,且當 A 趨近於 B 時(即兩者趨於重合),GIOU 趨於 IOU
  4. IOU 取值區間為 [0,1],GIOU 取值區間為 [-1,1]:
      和 3 中所說對應,A 和 B 趨於重合時 IOU 和 GIOU 均趨向 1
      A 和 B 差別越大,GIOU 趨向於 -1
  5. 如 Figure2 所示,GIOU 相對 IOU 更能反映兩個框相交形式的好壞(how overlap between two symmetrical objectsoccurs

4、GIOU 應用為損失函數

基於 min、max 和 分段函數的BP算法是可行的,所以 IOU 與 GIOU 的應用就不是問題了。作者說,雖然 IOU(GIOU) 計算不能得到解析解,但在限定了形狀為矩形時就大大簡化了問題:對角點進行 min、max 操作即可:

作者還畫了圖試圖證明 GIOU 損失函數的梯度相對於 IOU 損失函數更大,不過我感覺有點牽強(沒看懂),所以不貼了。

三、實驗

作者將 GIOU 損失函數應用到已有 2D 物體檢測算法中,結果相對從前在兩個指標上:IOU、GIOU 均有提高,畢竟優化目標就是檢測指標,比起使用中間量的 l2 損失效果好是情理之中的。

文章源碼還沒有被釋放,不過原理並不復雜,只要修改已有算法的損失函數即可,但是最近比較忙,沒有時間實踐一下了。個人覺得是篇很中肯的文章,期待其他人復現實驗驗證一下,如果效果好說不定就像 BN、Relu 一樣成為相關領域的標准配置了。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM