滑動窗口與選擇搜索


目標檢測物體的候選框是如何產生的?

  如今深度學習火熱的今天,RCNN/SPP-Net/Fast-RCNN等文章都會談及bounding boxes(候選邊界框)的生成與篩選策略。那么候選框是如何產生,又是如何進行篩選的呢?其實物體候選框獲取當前主要使用圖像分割與區域生長技術。區域生長(合並)主要由於檢測圖像中存在的物體具有局部區域相似性(顏色、紋理等)。目標識別與圖像分割技術的發展進一步推動有效提取圖像中信息。滑窗法作為一種經典的物體檢測方法,個人認為不同大小的窗口在圖像上進行滑動時候,進行卷積運算后的結果與已經訓練好的分類器判別存在物體的概率。選擇性搜索(Selective Search)是主要運用圖像分割技術來進行物體檢測。

—————————— 滑窗法(Sliding Window) ——————————

首先來看一下滑窗法的物體檢測流程圖:

  通過滑窗法流程圖可以很清晰理解其主要思路:首先對輸入圖像進行不同窗口大小的滑窗進行從左往右、從上到下的滑動。每次滑動時候對當前窗口執行分類器(分類器是事先訓練好的)。如果當前窗口得到較高的分類概率,則認為檢測到了物體。對每個不同窗口大小的滑窗都進行檢測后,會得到不同窗口檢測到的物體標記,這些窗口大小會存在重復較高的部分,最后采用非極大值抑制(Non-Maximum Suppression, NMS)的方法進行篩選。最終,經過NMS篩選后獲得檢測到的物體。

 

  滑窗法簡單易於理解,但是不同窗口大小進行圖像全局搜索導致效率低下,而且設計窗口大小時候還需要考慮物體的長寬比。所以,對於實時性要求較高的分類器,不推薦使用滑窗法。
  
—————————— 選擇搜索(Selective Search) —————————

同樣來看一下選擇搜索的物體檢測流程圖:

  滑窗法類似窮舉進行圖像子區域搜索,但是一般情況下圖像中大部分子區域是沒有物體的。學者們自然而然想到只對圖像中最有可能包含物體的區域進行搜索以此來提高計算效率。選擇搜索方法是當下最為熟知的圖像bouding boxes提取算法,由Koen E.A於2011年提出,具體詳見論文。下面大致說一下選擇搜索算法的過程:

 

  選擇搜索算法的主要觀點:圖像中物體可能存在的區域應該是有某些相似性或者連續性區域的。因此,選擇搜索基於上面這一想法采用子區域合並的方法進行提取bounding boxes候選邊界框。首先,對輸入圖像進行分割算法產生許多小的子區域。其次,根據這些子區域之間相似性(相似性標准主要有顏色、紋理、大小等等)進行區域合並,不斷的進行區域迭代合並。每次迭代過程中對這些合並的子區域做bounding boxes(外切矩形),這些子區域外切矩形就是通常所說的候選框。

選擇搜索優點:
  計算效率優於滑窗法。
  由於采用子區域合並策略,所以可以包含各種大小的疑似物體框。
  合並區域相似的指標多樣性,提高了檢測物體的概率。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM