小目標檢測的解決方法


在深度學習目標檢測中,由於小目標分辨率低,圖片模糊,信息少,噪聲多所以是一個實際且常見的困難問題

解決方法:使用不同分辨率的圖像金字塔,再對每層金字塔用固定輸入分辨率的分類器在該層滑動來檢測目標,以求在金字塔底部檢測出小目標;或者只用一個原圖,在原圖上,用不同分辨率的分類器來檢測目標,以求在比較小的窗口分類器中檢測到小目標。
參考1

1.[將圖像resize成不同的大小]
(http://xxx.itp.ac.cn/ftp/arxiv/papers/1604/1604.02878.pdf)

2.data augmentation:對小目標進行數據增強
1>過采樣策略oversampling,改變采樣率
2>針對同一張圖片里面包含小目標數量少的問題,在圖片內用實例分割的Mask摳出小目標圖片再使用復制粘貼的方法(當然,也加上了一些旋轉和縮放,另外要注意不要遮擋到別的目標)

3.特征金字塔網絡FPN
淺層特征圖感受野小適合小目標檢測,深層特征圖感受野大適合大目標檢測

4.人臉檢測SSH、Feature-Fused SSD、Deconvolutional Network

5.合適的訓練方法‘’模型預訓練的分布要盡可能地接近測試輸入的分布‘’SNIP(An Analysis of Scale Invariance in Object Detection)訓練時只訓練合適尺寸的目標樣本,只有真值的尺度和Anchor的尺度接近時來用來訓練檢測器,太小太大的都不要,預測時輸入圖像多尺度,總有一個尺寸的Anchor是合適的,選擇那個最合適的尺度來預測,SNIPER,SAN,R-FCN

6.更稠密的Anchor采樣和匹配策略S3FD,FaceBoxes
1>FaceBoxes:Inception3的anchors有三個scales(32,64,128),而32 scales是稀疏的,所以需要密集化4倍,而64 scales則需要密集化2倍
2>在S3FD人臉檢測方法中,則用了Equal-proportion interval principle來保證不同大小的Anchor在圖中的密度大致相等,

7.對小目標的Anchor使用比較寬松的匹配策略(比如IoU > 0.4),總之就是從anchor的密度,anchor的范圍,anchor的形狀數量來考慮,具體理解可參看2

8.GAN方法:使用GAN對小目標生成一個和大目標很相似的Super-resolved Feature,然后把這個Super-resolved Feature疊加在原來的小目標的特征圖上,以此增強對小目標特征表達來提升小目標的檢測性能。【Perceptual GAN】

9.利用Context信息的Relation Network和PyramidBox
比如檢測人臉時,圖片中不會僅僅只有一張臉,會有肩膀胳膊等,可以利用這些上下文信息,目標就變大了

10.ROI pooling和Context-Aware RoI Pooling,ROI align

11.回歸損失函數:不同大小的目標大小給不同的損失函數加權系數

12.增大小目標的GT,從而變相加大目標。增加檢測能力

13.Lucid Data Dreaming for Multiple Object Tracking,這是一種在視頻跟蹤/分割里面比較有效的數據增強手段,據說對於小目標物體檢測也很有效


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM