什么是特征?想一想我們是如何分辨物體的?更具體一點,你是如何辨別一張圖片里面的人臉是一個人臉的?其實很簡單,你會去找是不是有眼睛、嘴巴等面部器官。
當然這些器官的位置基本是固定的。是否有眼睛,眼睛之間的距離,眼睛跟鼻子的位置關系等等這些都叫特征。選擇使用特征的一個重要的原因:基於特征的系統的運行
速度要遠比基於像素的快。
說到特征,不得不提在識別領域中應用非常廣泛的哈爾特征。
歷史上,直接使用圖像的強度(就是圖像每一個像素點的RGB值)使得特征的計算強度很大。帕帕喬治奧等人提出可以使用基於哈爾小波的特征而不是圖像強度[1] 。維奧拉
和瓊斯[2]進而提出了哈爾特征。哈爾特征使用檢測窗口中指定位置的相鄰矩形,計算每一個矩形的像素和並取其差值。然后用這些差值來對圖像的子區域進行分類。
例如,當前有一個人臉圖像集合。通過觀察可以發現,眼睛的顏色要比兩頰的深。因此,用於人臉檢測的哈爾特征是分別放置在眼睛和臉頰的兩個相鄰矩形。這些矩形的
位置則通過類似於人臉圖像的外接矩形的檢測窗口進行定義。
圖一
在維奧拉-瓊斯目標檢測框架的檢測階段,一個與目標物體同樣尺寸的檢測窗口將在輸入圖像上滑動,在圖像的每一個子區域都計算一個哈爾特征。然后這個差值會與一個預
先計算好的閾值進行比較,將目標和非目標區分開來。因為這樣的一個哈爾特征是一個弱分類器(它的檢測正確率僅僅比隨機猜測強一點點),為了達到一個可信的判斷,就
需要一大群這樣的特征。在維奧拉-瓊斯目標檢測框架中,就會將這些哈爾特征組合成一個級聯分類器,最終形成一個強分類群。
哈爾特征最主要的優勢是它的計算非常快速。使用一個稱為積分圖的結構,任意尺寸的哈爾特征可以在常數時間內進行計算。
一個矩形哈爾特征可以定義為矩形中幾個區域的像素和的差值,可以具有任意的位置和尺寸。這種特質也被稱為2矩形特征(2-rectangle feature)。 維奧拉和瓊斯也定義了
3矩形特征和4矩形特征。這個值表明了圖像的特定區域的某些特性。每一個特征可以描述圖像上特定特性的存在或不存在,比如邊緣或者紋理的變化。例如,一個2-矩形特征
可以表明一個邊界位於一個亮區域和一個暗區域之間。
維奧拉和瓊斯的一個重要貢獻是使用積分圖[3] 。 積分圖是一個二維矩形的查找表,與原始圖像具有一樣的尺寸。積分圖的每一個元素是原始圖像在對應位置左上角所有像素的和。
這就使得在任意位置計算任意尺寸的矩形的像素和時,只需要進行四次查表:
其中點 屬於原始圖像 ,如圖一所示。每個哈爾特征的查找次數取決於它的定義。維奧拉和瓊斯的2矩形特征需要六次查詢,3矩形需要八次,而4矩形則需要九次。
參考文檔:
1 https://zh.wikipedia.org/wiki/%E5%93%88%E5%B0%94%E7%89%B9%E5%BE%81