目標檢測之R-CNN系列和YOLO


一、R-CNN 區域卷積神經網絡

  對每張圖選取多個區域,然后每個區域作為一個樣本進入一個卷積神經網絡來抽取特征,最后使用分類器來對齊分類,和一個回歸器來得到准確的邊框。

步驟:

  1. 對輸入的每張圖片使用一個基於規則的“選擇性搜索”算法來選取多個提議區域
  2. 選取一個預先訓練好的卷積神經網絡並去掉最后一個輸出層,每個區域被調整成這個網絡要求的輸入大小並計算輸出,這個輸出將作為這個區域的特點
  3. 使用這些區域特征來訓練多個SVM來做物體識別,每個SVM是預測一個區域是否包含某個物體
  4. 使用這些區域特征來訓練線性回歸器將提議區域

可能會特別慢,一張圖可以選出上千個區域,導致一張圖要做上千次預測。

 

二、Fast  R-CNN 快速的區域卷積神經網絡

  改進:1、R-CNN里面的大量區域是相互覆蓋的,重新抽取過於浪費,因此Fast R-CNN先對輸入圖片抽取特征,然后選取區域。2、使用單個邏輯回歸來分類。

 

三、Faster R-CNN 更快速的區域卷積神經網絡

  改進:提出了區域提議網絡RPN來代替選擇性搜索。

  1. 在輸入特征上放置一個填充為1通道是256的3*3卷積。這樣每個像素,連同它的周圍8個像素,都被映射成一個長為256的向量。
  2. 以每個像素為中心,生成k個大小和長寬比都預先設計好的默認邊框,通常也叫錨框
  3. 對每個邊框,使用其中心像素對應的256維向量作為特征,RPN訓練一個2類分類器來判斷這個區域是不是含有任何感興趣的物體還是只是背景,和一個4維輸出的回歸器來預測一個更准確的邊框。
  4. 對於所有的錨框,個數為nmk果輸入大小是n*m,選出被判斷成還有物體的,然后前他們對應的回歸器預測的邊框作為輸入放進接下來的RoI池化層。

  RPN思想非常直觀。首先提議預先配置好的一些區域,然后通過神經網絡來判斷這些區域是不是感興趣的,如果是,那么再預測一個更加准確的邊框。這樣我們能有效降低搜索任何形狀的邊框的代價。

 

四、YOLO

  改進:生成的錨框不是重疊的,將圖片均勻地分成S*S塊,每一塊當作一個錨框。每個錨框預測B個邊框以及這個錨框包含哪個物體。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM