目標檢測任務理解與總結
從字面意義理解,所謂目標檢測任務,就是定位並檢測目標,也就是說計算機在處理圖像的時候需要解決兩個問題:
1.What? —— 圖像中是什么東西?我們的目標是要檢測什么東西?—— 識別 Recognition
2.Where? —— 在圖像的什么位置?目標的定位坐標大致范圍是多少?—— 定位 Localization
在目標檢測算法中,通過最小外接矩形(Bounding box)來進行目標定位,同時利用預設類別標簽(Category label)來進行目標對象類別的區分,於是這個圖像檢索的問題就被描述成,計算機在進行目標檢測任務時,只需要識別出對應的框體和類別名稱,即解決了當前圖像的目標檢測問題。
其中有兩項比較重要的參數是幫助描述和實現目標檢測任務的關鍵:類別標簽和置信度得分。
- 類別標簽(Category label):對於當前標記目標類別的標簽名稱或標記符號稱為類別標簽。
- 置信度得分(Confidence score): 用來描述和確認當前檢測目標為某一個標記類別的接近程度。
與其他類型(圖像分類、實例分割)任務相比
從單目標對象的角度來看,分類僅針圖像中的目標本身,而分類+定位則需要在分類的基礎上框選其目標范圍;
從多目標對象的角度來看,目標檢測需要對圖像中的不同目標進行最小外界矩形定位和標簽分類,而實例分割則需要對圖像中的不同目標邊界輪廓進行包圍標注和標簽分類。
具體地來說,我們將定位和檢測這兩種不同的問題,描述為以下的任務:
定位和檢測:
- 定位:定位是找到檢測圖像中帶有一個給定標簽的單個目標
- 檢測:檢測是找到圖像中帶有給定標簽的所有目標。