在目標檢測的研究過程中,深度學習一直占居着主要的位置。通過搭建不同的網絡模型,對當前兩大主流開源數據集PASCALVOC和IMAGENET進行測試並評估,已然成了一種新風向。
作為計算機視覺三大頂會:CVPR,ICCV,ECCV,每年都會有該方向的最新成果。
接下來匯總一下,以便需要時查看:
2014 ----------------------------------------------------------------- RCNN 58.5 CVPR(2014) SPPNET 59.2 ECCV(2014) -----------------------------------------------------------------
2015 ----------------------------------------------------------------- Fast-RCNN 70 ICCV(2015) Faster-RCNN 73.2 NIPS(2015) ----------------------------------------------------------------- 2016 ----------------------------------------------------------------- YOLOv1 66.4 CVPR(2016) :使用單個前饋卷積網絡直接預測對象類和位置。 ION / HyperNet / OHEM SSD 76.8 ECCV(2016) :在多個ConvNet層擴展了不同尺度的anchors,強制每個層專注於預測確定尺寸對象。 RFCN 79.5 NIPS(2016) -----------------------------------------------------------------
2017 ----------------------------------------------------------------- DSSD 81.5 Arxiv(2017) :在SSD基礎上引入額外的上下文,通過反卷積來提高准確性。 FPN / TDM YOLOv2 78.6 CVPR(2017) :添加所有卷積層上的批量標准化,使用主分辨率分類器,使用帶anchor boxes的卷積層替代全連接層來預測bboxes。 RoN(Reverse connection with Objectness prior Networks for object detection)
DES(Detection with Enriched Semantics)
基於SSD,解決小目標檢測效果不好,基於VGG16設計的DES算法,在VOC2007測試集上實現了81.7mAP的准確率,
在COCO的測試-驗證集上實現了32.8mAP的准確率,並且每張圖片只花費31.5ms。
參考鏈接:
https://blog.csdn.net/woduitaodong2698/article/details/85327403
/ DCN / DeNet / CoupleNet /
RetinaNet :重塑標准交叉熵損失,聚焦訓練在一組稀疏的hard examples,降低分配給分類良好的例子的損失權重。解決類別不平穩性
MaskRCNN
DSOD :設計了一個框架和一套原則來從頭開始學習目標檢測器
SqueezeNet: ICLR(2017):輕量化模型之SqueezeNet
----------------------------------------------------------------- 2018 ----------------------------------------------------------------- YOLOv3 Arxiv(2018) : 目標檢測之車輛行人(darknet版yolov3)
RefineDet 83.8 CVPR(2018) :目標檢測之RefineDet
-----------------------------------------------------------------
另外,還有一些先進的模型,如:
MFFD(模塊化特征整合檢測器):https://www.auto-testing.net/news/show-103137.html