目標檢測方法系列——R-CNN, SPP, Fast R-CNN, Faster R-CNN, YOLO, SSD
目錄
-
相關背景
-
從傳統方法到R-CNN
-
從R-CNN到SPP
-
Fast R-CNN
-
Faster R-CNN
-
YOLO
-
SSD
-
總結
-
參考文獻
-
推薦鏈接
相關背景
-
14年以來的目標檢測方法(以R-CNN框架為基礎或對其改進)
-
各方法性能對比
-
分類,定位,檢測三種視覺任務的簡單對比
-
一般的目標檢測方法
從傳統方法到R-CNN
-
R-CNN的三大步驟:得到候選區域,用cnn提取特征,訓練分類器(后兩步放在一個網絡中,用softmax做分類器也可以)
從R-CNN到SPP
-
R-CNN必須限制輸入圖像大小(全連接層要求)
-
SPP的兩大優勢:可變輸入大小 + 各patch塊之間卷積計算是共享的
-
SPP的缺陷:multi-stage,訓練和測試都比較慢
Fast R-CNN
-
Fast R-CNN通過ROI pooling(一層的SPP),multi-task等改進大大提高速度
-
Fast R-CNN的優勢與弱勢
Faster R-CNN
-
Faster R-CNN對於Fast R-CNN的改進在於把region proposal的步驟換成一個CNN網絡(RPN)
-
Faster R-CNN的兩個base model: ZF,VGG16 (base model的中間conv輸出即為要輸入到RPN的那個feature map)
-
Faster R-CNN的錨點anchor box
-
Faster R-CNN的損失函數
-
Faster R-CNN的四步訓練
YOLO
-
從Faster R-CNN到YOLO
-
YOLO的pipeline
-
YOLO的網絡結構
-
YOLO的模型(最右圖為網絡輸出的tensor)
-
YOLO的損失函數
-
YOLO的優勢和劣勢
SSD
-
SSD的pipeline和關鍵技術
-
SSD的網絡結構
-
SSD的多尺度特征圖
-
SSD的default box
-
SSD的default box與faster r-cnn的anchor box的對比
-
SSD的訓練樣本與groundTruth的匹配策略 + 損失函數
-
SSD的default box和尺度選擇
總結
-
從R-CNN → SPP → Fast R-CNN → Faster R-CNN → YOLO → SSD整體在准確率和速度上都在提高
參考文獻
-
R-CNN
-
-
- Girshick, R., Donahue, J., Darrell, T., Malik, J.: Rich feature hierarchies for accurate object detection and semantic segmentation. In: CVPR. (2014)
-
-
SPP
-
- He, K., Zhang, X., Ren, S., Sun, J.: Spatial pyramid pooling in deep convolutional networks for visual recognition. In: ECCV. (2014)
-
-
Fast R-CNN
-
- Girshick, R.: Fast R-CNN. In: ICCV. (2015)
-
-
Faster R-CNN
-
- Ren, S., He, K., Girshick, R., Sun, J.: Faster R-CNN: Towards real-time object detection with region proposal networks. In: NIPS. (2015)
-
-
YOLO
-
- Redmon, J., Divvala, S., Girshick, R., Farhadi, A.: You only look once: Unified, real-time object detection. In: CVPR. (2016)
-
-
SSD
-
- W. Liu, D. Anguelov, D. Erhan, C. Szegedy, and S. Reed. SSD: Single shot multibox detector. arXiv:1512.02325v2, 2015
-
推薦鏈接
-
Object detection methods (codes)
-
所有目標檢測方法的中文總結(博客)
-
Faster RCNN的論文閱讀
-
YOLO的論文閱讀
-
R-FCN的論文閱讀
-
SSD的論文閱讀