目標識別(objec recognition)是指明一幅輸入圖像中包含哪類目標。其輸入為一幅圖像,輸出是該圖像中的目標屬於哪個類別(class probability)。
目標檢測(object detection)除了要告訴輸入圖像中包含哪類目標外,還要框出該目標的具體位置(bounding boxes)。
滑窗法是一種經典的物體檢測方法。滑窗法的原理:首先對輸入圖像進行不同窗口大小的滑窗進行從左往右、從上到下的滑動。每次滑動時候對當前窗口執行分類器(分類器是事先訓練好的)。如果當前窗口得到較高的分類概率,則認為檢測到了物體。對每個不同窗口大小的滑窗都進行檢測后,會得到不同窗口檢測到的物體標記,這些窗口大小會存在重復較高的部分,最后采用非極大值抑制(Non-Maximum Suppression, NMS)的方法進行篩選。最終,經過NMS篩選后獲得檢測到的物體。
選擇性搜索(Selective Search)是主要運用圖像分割技術來進行物體檢測。選擇搜索算法的原理:圖像中物體可能存在的區域應該是有某些相似性或者連續性區域的。因此,選擇搜索基於上面這一想法采用子區域合並的方法進行提取bounding boxes候選邊界框。首先,對輸入圖像進行分割算法產生許多小的子區域。其次,根據這些子區域之間相似性(相似性標准主要有顏色、紋理、大小等等)進行區域合並,不斷的進行區域迭代合並。每次迭代過程中對這些合並的子區域做bounding boxes(外切矩形),這些子區域外切矩形就是通常所說的候選框。