1、Feature-Fused SSD: Fast Detection for Small Objects (ICGIP2017)
融合特征的SSD
[1709.05054] Feature-Fused SSD: Fast Detection for Small Objects https://arxiv.org/abs/1709.05054
論文:https://arxiv.org/ftp/arxiv/papers/1709/1709.05054.pdf
快速檢測小目標,采用SSD作為基本結構,兼顧速度和准確度。
思路是使用高層的特征圖來加強低層特征圖的語義信息,以增加小物體檢測精度。
不同層特征融合得到contextual information(上下文信息)的方法,並將其應用到SSD模型中。
SSD使用特征金字塔是為了兼顧不同尺度目標的檢測,把最淺層的特征用到小目標檢測上,因為淺層的感受野小,感受野的尺寸正好和小目標match。
淺層的特征缺乏語義信息(Semantic information) 。而語義信息會影響檢測器判斷檢測區域是目標 (object) 還是背景 (background)。那么將高層特征與低層特征融合,將會得到感受野適合,而又不缺乏語義信息的特征。
Element-Sum module 和concatenation module兩種融合方式:拼接時使用,concat還是sum操作。
concatenation module能降低遮擋的影響而Element-Sum module針對像素少和模糊的目標有更好的效果。
【轉載自】
快速小目標檢測--Feature-Fused SSD: Fast Detection for Small Objects - AI小作坊 的博客 - CSDN博客 https://blog.csdn.net/zhangjunhit/article/details/78031452
小目標檢測:Feature-Fused SSD - 海星的博客 - CSDN博客 https://blog.csdn.net/weixin_39290638/article/details/84540806
Feature-Fused SSD: Fast Detection for Small Objects - DCD_LIN的博客 - CSDN博客 https://blog.csdn.net/linmingan/article/details/81095435
融合特征的SSD:對小目標的快速檢測 - wangxujin666的博客 - CSDN博客 https://blog.csdn.net/wangxujin666/article/details/83065261
2、FPN(feature pyramid networks)
論文:feature pyramid networks for object detection 5 FPS
論文鏈接:https://arxiv.org/abs/1612.03144
這是cvpr2017年出的一篇文章,該文主要是針對通用目標的檢測方法,但是在小目標檢測中起到了關鍵作用,以至於之后的很多小目標檢測方法都用到了類似的該方法,如faster-rcnn+fpn,yolov3中的特征融合。
為了在保證速度的同時實現更高的定位准確率,yolo v3 采用了更為復雜的網絡結構。相較於此前的網絡,yolo v3 的改進之處包括多尺度預測(FPN)、更復雜的網絡的結構Darknet53、取消 softmax 作為候選框分類,這些都使得 yolo v3 的速度更快,准確率也有相應提高。 |
采用了多尺度特征融合的方式,采用不同特征層特征融合之后的結果來做預測。
低層的特征語義信息比較少,但是目標位置准確,高層的特征語義信息比較豐富,但是目標的位置粗略。
FPN的方法,得到每一層的特征圖之后采用自頂向下的方法將小的特征圖上采樣之后與下一個特征圖融合,融合之后再做預測,依次如此,即可得到多個預測結果。
Feature Pyramid Network
算法思想:作者提出了從上到下的路徑和橫向路徑。從上到下的路徑是指對網絡結構深層的特征圖進行上采樣操作,使其跟網絡淺層特征圖大小一致,從而能夠進行特征圖堆疊。橫向路徑是指對每一卷積模塊的最終特征圖,采用1X1卷積核進行降通道操作, 減少特征圖的個數。最終利用堆疊起來的多尺度特征圖進行分類及定位的模型學習。
算法效果:對於FPN做法的可行性,作者指出,淺層特征圖的語義特征較弱,而位置特征較強;相反,深層特征圖的語義特征較強, 但損失了精確地位置特征。同時利用淺層特征圖和深層特征圖,能夠綜合考量強位置特征和強語義特征,因此提升模型效果。
Fully Convoluntional Network
算法思想:整體思想與FPN相似。創新點在於(1)舍棄了全連接層,將全連接層換為等價的1X1卷積核,從而使得網絡輸入的圖片尺度可以不一致。(2)對堆疊后的特征圖繼續進行上采樣,使得其和原圖大小一致。對上采樣后的堆疊特征圖,在其映射到原圖位置的像素點上做分類預測。這樣,可以基於原圖做出精細的圖像分割。
算法效果:FCN開創了精細圖像分割的先河,其之后的MASK-RCNN等算法也借鑒了其思想。對於小目標檢測,可以通過像素點的分類,做出更精細的位置划分。
【轉載自】
小目標檢測文章總結 - wq604887956的博客 - CSDN博客 https://blog.csdn.net/wq604887956/article/details/83053927
小目標檢測論文閱讀 - 開心的火龍果的博客 - CSDN博客 https://blog.csdn.net/weixin_40683960/article/details/82078957
【其他】
https://cloud.tencent.com/developer/article/1414911
小目標檢測:Improving Small Object Detection - 海星的博客 - CSDN博客 https://blog.csdn.net/weixin_39290638/article/details/84487984
卷積神經網絡可以用於小目標檢測嗎? - 知乎 https://www.zhihu.com/question/49722539