曠世科技IoU-Net

本文轉載自查看原文 2018-10-24 01:07 2148

Acquistion Location Confidence for accurate object detection

本論文主要是解決一下兩個問題：

1、分類得分高的預測框與IOU不匹配，（我猜應該是訓練數據集導致的）

2、基於回歸的邊框修正是非單調的，缺乏可解釋性。

貢獻點

（1）傳統 NMS : 根據邊界框的分類置信度排序，每次選擇cls score最大的框，並對與它IoU大於閾值的框抑制。定位准確的邊界框中有很大一部分會被錯誤抑制，這是由分類置信度和定位准確度之間的不匹配造成的，

（2）IoU-NMS : 使用預測得到的IoU來對預測框進行排序，每次選擇IoU最大的框並對與它IoU大於一定閾值的框抑制。

（3）soft-NMS：NMS基礎上，IoU 大於閾值的框不將其分類置信度置為0。

為了使用IoU來指導排序，但在在測試的時候沒有GroundTruth信息，於是設計一個網絡來

估計邊框與GroundTruth的IoU。如下圖所示。

虛線框的是IoU-Net。

輸入：Jittered-RoIs：通過對groundtruth 隨機變換得到一系列的候選框（而不采用RPN輸出的RoIs）

損失：smooth-L1 LOSS

輸出：候選框與GroundTruth的IoU交並比（用於后續的IoU-guided NMS和優化修正算法）

因為RPN網絡輸出的bounding box的坐標是浮點數，

論文中的不足之處，缺少PrRoI-pooling的對照實驗。在Mask-RCNN中的RoIAlign的精度相對於RoIPool明顯提高。

The code is released at: https://github.com/vacancy/PreciseRoIPooling

問題：

基於回歸的邊界框精修非單調，對輸入的分布變化敏感，不同的預測框迭代次數沒法自適應。

解決方法：

通過每次修正得到的邊界框預測得到IoU來修正。

基於優化的算法部分：

每次迭代對不同的預測框都做一次修正，因為PrRoI-Pool是連續可導的，所以通過梯度上升的方式進行優化，計算出邊界框的變換。當變換后的邊界框送入IoU-Net得到新的IoU與舊的IoU區別小於一定值或者出現退化，該邊界框就不在修正。

基於回歸的方法：如圖第一排隨着迭代次數的增加，紅色的預測越來越偏離GroundTruth

基於優化的方法：如圖第二排隨着迭代次數增加，預測框越來越精確。

（1）數據集：

80類別的MS-COCO 80k張訓練圖像和35k張驗證圖像，5k張驗證圖像做測試。

（2）訓練參數設置：

輸入圖像裁剪為1200*800的大小

IoU-Net的訓練數據是另外產生的。對於IoU-Net的 IoU標簽通過正則化變為【-1，1】之間。

每層的參數設置為mean=0，標准差=0.01或0.001的高斯分布，batchsize大小為16，在推理部分，先還是使用了一次邊框回歸來初始化坐標，為了加快推理，對所有檢測框做IoU -NMS前100個最大分類置信度的邊框再使用基於優化的算法進行微調。

相比於soft-NMS，采用了IoU-NMS的結果在AP90上明顯提高了。

問題：AP50的結果較差。

問題原因：因為較小的IoU的框與GroundTruth的特征差異大，導致了IoU預測器不精確，修正也退化了。

解決方法：通過采集更多小IoU的來訓練就可以解決

IoU-Net相較於FPN、Mask-RCNN速度下降了一點，但精度有所提升，時間耗費應該主要是在基於優化的邊框修正上

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 ECCV 2018 目標檢測 | IoU-Net：將IoU的作用發揮到極致 python實現IOU計算 python實現IoU （原）IOU的計算【NMS與IOU代碼】 GIOU 相比於IOU的好處微軟黑科技強力注入，.NET C#全面支持人工智能目標檢測中常用的IOU、NMS和mAP intersection-over-union(IoU: 交並比) 兩個Bounding Box的IOU計算代碼