人臉檢測---特征的提取


   什么是特征?想一想我們是如何分辨物體的?更具體一點,你是如何辨別一張圖片里面的人臉是一個人臉的?其實很簡單,你會去找是不是有眼睛、嘴巴等面部器官。

當然這些器官的位置基本是固定的。是否有眼睛,眼睛之間的距離,眼睛跟鼻子的位置關系等等這些都叫特征。選擇使用特征的一個重要的原因:基於特征的系統的運行

速度要遠比基於像素的快。

  說到特征,不得不提在識別領域中應用非常廣泛的哈爾特征。

歷史上,直接使用圖像的強度(就是圖像每一個像素點的RGB值)使得特征的計算強度很大。帕帕喬治奧等人提出可以使用基於哈爾小波的特征而不是圖像強度[1] 。維奧拉

和瓊斯[2]進而提出了哈爾特征。哈爾特征使用檢測窗口中指定位置的相鄰矩形,計算每一個矩形的像素和並取其差值。然后用這些差值來對圖像的子區域進行分類。

例如,當前有一個人臉圖像集合。通過觀察可以發現,眼睛的顏色要比兩頰的深。因此,用於人臉檢測的哈爾特征是分別放置在眼睛和臉頰的兩個相鄰矩形。這些矩形的

位置則通過類似於人臉圖像的外接矩形的檢測窗口進行定義。

   

    圖一

維奧拉-瓊斯目標檢測框架的檢測階段,一個與目標物體同樣尺寸的檢測窗口將在輸入圖像上滑動,在圖像的每一個子區域都計算一個哈爾特征。然后這個差值會與一個預

先計算好的閾值進行比較,將目標和非目標區分開來。因為這樣的一個哈爾特征是一個弱分類器(它的檢測正確率僅僅比隨機猜測強一點點),為了達到一個可信的判斷,就

需要一大群這樣的特征。在維奧拉-瓊斯目標檢測框架中,就會將這些哈爾特征組合成一個級聯分類器,最終形成一個強分類群

  哈爾特征最主要的優勢是它的計算非常快速。使用一個稱為積分圖的結構,任意尺寸的哈爾特征可以在常數時間內進行計算。

一個矩形哈爾特征可以定義為矩形中幾個區域的像素和的差值,可以具有任意的位置和尺寸。這種特質也被稱為2矩形特征(2-rectangle feature)。 維奧拉和瓊斯也定義了

3矩形特征和4矩形特征。這個值表明了圖像的特定區域的某些特性。每一個特征可以描述圖像上特定特性的存在或不存在,比如邊緣或者紋理的變化。例如,一個2-矩形特征

可以表明一個邊界位於一個亮區域和一個暗區域之間。

  維奧拉和瓊斯的一個重要貢獻是使用積分圖[3] 。 積分圖是一個二維矩形的查找表,與原始圖像具有一樣的尺寸。積分圖的每一個元素是原始圖像在對應位置左上角所有像素的和。

這就使得在任意位置計算任意尺寸的矩形的像素和時,只需要進行四次查表:

{\displaystyle {\text{sum}}=I(C)+I(A)-I(B)-I(D).\,}

其中點 {\displaystyle A,B,C,D} 屬於原始圖像 ,如圖一所示。每個哈爾特征的查找次數取決於它的定義。維奧拉和瓊斯的2矩形特征需要六次查詢,3矩形需要八次,而4矩形則需要九次。

 

參考文檔:

1 https://zh.wikipedia.org/wiki/%E5%93%88%E5%B0%94%E7%89%B9%E5%BE%81 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM