《論文翻譯》 GIOU


廣義交並比-GIOU(回歸檢測的一種指標和Loss)

注釋

  • 本系列《論文翻譯》僅代表個人觀點
  • 目的提高英文閱讀能力
  • 錯誤之處較多,歡迎讀者修正,在此感謝

1. 摘要

  目標檢測的評價指標最常使用的是交並比進行度量。然而在優化(經常使用距離參數對邊界框進行回歸)和最大化(最大化這個度量參數)之間存在一些缺陷(這里指代價函數和優化目標之間存在不對等情況,具體看后文就會明白)。度量的最優目標就是其本身。在軸對稱的情況下,IOU可以直接當做回歸損失。然而,在不想交的情況下,IOU是不能當做度量值的。在本文中,我將通過介紹一種新的度量(GIOU)和LOSS計算方法來解決IOU的缺點。通過把GIOU融合進當前最先進的網絡之中(數據集使用當前最流行的基准PASCAL VOC、COCO等),對比GIU和IOU,展示出GIOU一致的優於IOU的表現。

2. 介紹

  框回歸是2D、3D計算機視覺任務中最重要的組成部分之一。任務包括:目標定位、多目標檢測、目標跟蹤、依靠高精度的框回歸實例級分割。 使用深度神經網絡去提高應用的性能,占主導地位的方法是提出一個更好的基礎架構或者更好的策略來提取更精確的特征。然而一個很好的提高方法被忽視,使用損失的度量方法IOU去代替回歸損失(L1--LOSS、L2--LOSS)。

圖1

  IOU又被稱為Jaccard索引,常用來作為兩個任意形狀目標相似性對比。IOU對目標的形狀屬性進行編碼,長寬高位置等,然后對他們的區域計算一個標准的度量。由IOU的計算屬性,具有尺度不變性。由於這個良好的屬性,所以被廣泛的應用在分割和目標檢測中進行性能評價。

  然而,IOU沒有表現出很好的相關性,對於 \(l_n-norms\) 等損失最小化(2D、3D中兩個框參數化)和提高他們IOU值。例如:在圖1(a)中,假設LOSS采用\(l_2-norm\)進行表示,則每個LOSS的大小相同。相同的論述可以推廣到其他的loss(圖b和圖c)。直觀上,一個好的目標局部最優不一定是IOU局部最優。和IOU相反,\(l_n-norm\) 是不具有尺度不變性的。為了這個目的,一些具有透視變換的區域(同一水平),那么他們計算出的LOSS就不相同。此外,一些不同的參數化類型表述之間可能缺少標准化。比如使用中心點和大小表示的\((x,y,w,h)\),隨着更多參數(旋轉、或者增加一個維度表示)的合並,復雜度也會增加。為了解決上述的問題,一些優秀的檢測器提出了的概念,來做一個初始化的假設。又定義一個非線性的參數來對尺度進行補償。即使做了這些手動改變,也不無彌補優化器和IOU之間的差別。注釋:這是表達的意思是我們進行訓練最小化的東西A,評價的指標B,A和B之間沒有統一(標准化)。例如,最小二乘法,我們最小化和評價的指標都是一個(平均垂直到線的距離最小)。而在目標檢測的時候我們使用的是L1-LOSS,而評價的時候使用IOU。作者給出的圖一發現這兩個不統一。Anchor的出現是為了簡化目標得表示方式,尺度參數的出現(SSD里面是編解碼)是為了解決多尺度問題

  在這篇文章中,我們發現一種與流行方法不同的可計算IOU,在兩個軸對齊的情況下,可以直接得到解,並且此方式可以反向傳播。也可以使用優化器進行優化得到最優值。在2D、3D的目標檢測中可以非常好的使用IOU進行計算。這樣IOU既可以當做優化函數,也可以作為度量函數。然而,IOU同時作為度量和LOSS存在一個重要問題:如果兩個框不想交,那么就無法衡量兩個框的距離,同時值為0,當計算梯度的時候就無法使用優化器進行傳播。

  在這篇文章中,我們通過擴充IOU的概念(范圍)去解決不想交的情況。我們確保具有以下性質:(a)和IOU的定義一樣,對邊界進行編碼。(b)保持尺度不變性。(c)在相交的情況和LOSS有很強的相關性。我們介紹的方法稱為GIOU,作為解決兩個任意形狀的幾何相關性。我們也提供了一種計算GIOU的分析方案,在兩個軸對齊的情況下,讓它稱為計算LOSS的一種途徑。在當前最先進的檢測網絡合並入GIOU,可以達到比之前都有提升的結果。。。(后面都是和摘要相同)。

  這篇文章最主要的貢獻總結如下(都是廢話):

  • GIOU用於對比兩個任意形狀的框
  • 提供計算方案
  • 在網絡進行了實驗

3. 相關工作

  目標檢測精度測量:IOU作為基礎,當IOU大於0.5時候作為計算輸入,使用mAP作為衡量基准。

  邊界框的表現和LOSS計算:說了一些傳統論文的計算方法。。。。

  使用近似IOU或一個替代函數:在語義分割任務中,他們做了一些努力,使用近似或另外的函數替代LOSS的計算。在當前的目標檢測中,部分論文已經開始使用IOU作為LOSS的計算,但是在不想交的情況下如何應用還是個未解決的問題。

4. 廣義交並比

  IOU用來衡量兩個任意形狀的相關性:

\[IOU=\frac{|A\bigcap B|}{A\bigcup B} \]

  IOU作為2D、3D目標檢測評價函數最廣泛的使用,主要包括兩個優點:

  • IOU表示一個距離,假設\(L_{IOU}=1-IOU\)為一個指標,也就意味着\(L_{IOU}\)滿足所有的屬性,包括難以辨認的、對稱的、不等三角等。
  • IOU具有尺度不變性,這也就意味着,在\(S\)空間中,A和B的關系對於尺度具有不變性。

然而,IOU存在一個主要的缺點:

  • \(|A\bigcap B|=0\)\(IOU(A,B)=0\)。在這種情況下,IOU無法反應出兩個形狀在附近還是非常遠。

為了解決這個問題,我們提出一個擴充的IOU來解決這個問題,命名為GIOU。

。。。說了一段計算GLOU的話,就是如下公式:

圖二

GIOU具有如下的優點:

  • 和IOU類似
  • 尺度不變
  • GIOU <= IOU
  • 0 =< IOU <= 1

5. GIOU作為目標檢測的LOSS

這部分很簡單,IOU怎么計算的,GIOU同樣計算

  下面放一張原論文的計算圖即可:

圖三

  LOSS的穩定性分析:當出現一些極端情況的時候,哪個度量方式會使LOSS更穩定?

圖4

6. 實驗結果

不進行分析,直接看結果即可

圖5

7. 個人理解

  本文的思想非常簡單,就是說LOSS和評估函數得相等,不然LOSS學到的東西不等於評價結果。主語如果做得論文說的很清楚,這里不再贅述。

關於網上說的幾個問題,這里個人回答一波

  1. 為什么 \(、L_1、L_2\) 作為LOSS可以得出不錯的結果?

其實回答這個問題很簡單,因為\(、L_1、L_2\)的計算在一定情況下是符合優化目標的

試想一下,SSD的框定義那么多,總有一個符合計算模式的(而且是精心設計的框)

如果按照作者說的,把anchor和GroundTrue全部不想交試試?gradient=0怎么計算?

  1. 為什么GIOU的效果不明顯,有的反而不好?

不明顯?

效果不明顯是因為SSD這種框太多了,很多都符合\(、L_1、L_2\)的計算模式了。

可以試試把SSD框降低,同時一張圖像中的目標增加

反而不好?

按照理論分析基本不可能

單詞匯總

  • metric:度量
  • optimal: 最優
  • plateau: 平面
  • infeasible: 不可行
  • adress: 解決
  • incorporating:合並
  • consistent:一致的
  • instance level segmentation:實例級分割
  • dominate:占統治地位
  • utilizing:利用
  • surrogate:取代、代替
  • arbitrary:任意的
  • appealing:吸引人的(appeal呼吁、吸引)
  • significant:明顯的
  • intuitive:直觀上
  • to this end:為了這個目的
  • alleviate:減輕
  • compensate:補償
  • prevailing:流行的
  • maintains:保持
  • remedy:修正
  • crucial:重要的
  • volumes:容器
  • fulfill:滿足
  • discern:辨認、識別
  • symmetry:對稱
  • vicinity:附近
  • ellipse:橢圓
  • tighter:緊
  • protocol:協議


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM