經典目標檢測框架的要點總結


 

 

本篇寫於18年暑假,后來轉戰跟蹤就沒怎么更新過,梳理了幾個經典目標檢測的點,以及他們的性能分數,本打算做畢設的時候梳理借鑒,沒想到只能到這里了。

 

一.RCNN

  1. 選擇性搜索
  2. Crop后分類(兩種傳入網絡的方法,那種長寬都縮放到網絡大小的比較好)
  3. SVM分類(FC的沒有SVM的好,可能畢竟是沒有訓練吧)
  4. 速度:50s/img(慢)
  5. Bounding Box 回歸

 

 

二.Fast-RCNN

  1. ROI(可BP
  2. 建議區還是選擇性搜索
  3. 速度:0.32

 

三.Faster-RCNN

  1. RPN 位置建議網絡,輸出那一層,每個卷積核對應一種anchor(不同大小長寬比)的一種屬性(置信分、x,y,h,w
  2. ROI這里補充說明,RPN回歸的x,y是浮點數,需要取整數、再打格子
  3. 速度:0.2

 

四.RFCN

  1. 是雙階段的(還是有rpn
  2. 沒有后面的FC,而是改用卷積的形式
  3. 還是打格子了,只是每個格子用一個卷積核來算,卷積核跑過一遍后,每個點就對應每個這個位置作為格子一角的分數
  4. 取值的時候,PR對應的區域在map上打格子,屬於同一個格子的點求平均(比如深藍色屬於左下角,但是PR只要ROI上的一小塊,而不是整個ROI,最后這樣組合起來投票)

 

 

五.YOLO (you only look once)

  1. 最后又經歷過FC
  2. 既然是7*7,應該是對大目標比較好

 

六.Yolo2

  1. 主要是trick(以前的問題現在看來是trick
  2. Anchor居然沒有
  3. DarkNet(速快,可用在移動端或者簡化加速)
  4. Yolo3的時候對小目標也不錯了

七.PVANet

  1.速度快性能好

  2.crelu(減半的卷積數,差不多的性能),可以借鑒

八.SSD

  1. 雖然是單階段,但是輸出層是有根據anchor來的
  2. 沒有特征融合?
  3. 數據增強
  4. 輸入越大越好

九.RetinaNet

  1. focal loss (單階段不一定不好,只是訓練樣本的不均衡導致)
  2. 單階段+fpn

 

 

 

十.Mask-RCNN

  1. Mask多任務
  2. ROI Align (直接在回歸的pr上打格子做插值)

 

十一.DSSD

  1. 特征融合
  2. 1*1的卷積(c)最好
  3. 長寬比聚類
  4. 測試的時候刪除bn層,速度1:2× - 1:5×

 

 

 

十二.RefineDet

  1. 單階段的,快,好用,對小目標好
  2. 有類似雙階段的anchor精煉過程
  3. +號的是多尺度

 

 

十三.Deformable Convolutional Networks (DCN)

  1. 卷積變形(偏移)
  2. ROI偏移
  3. 慢,但想法好

十四.CornerNet

論文地址:https://arxiv.org/abs/1808.01244

https://github.com/umich-vl/CornerNet

  1. 角點檢測(左上、右下)
  2. 通過embeddings確認同目標的兩點
  3. 提出Corner pool,有效平滑特征圖,凸顯角點
  4. 最后的角點還加了offset微調,就有點像雙階段
  5. 基礎網絡用沙漏網絡
  6. 單階段最佳

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM