人臉檢測---特征的提取

本文轉載自查看原文 2018-05-04 13:32 3990 視頻技術

　　什么是特征？想一想我們是如何分辨物體的？更具體一點，你是如何辨別一張圖片里面的人臉是一個人臉的？其實很簡單，你會去找是不是有眼睛、嘴巴等面部器官。

當然這些器官的位置基本是固定的。是否有眼睛，眼睛之間的距離，眼睛跟鼻子的位置關系等等這些都叫特征。選擇使用特征的一個重要的原因：基於特征的系統的運行

速度要遠比基於像素的快。

　　說到特征，不得不提在識別領域中應用非常廣泛的哈爾特征。

歷史上，直接使用圖像的強度(就是圖像每一個像素點的RGB值)使得特征的計算強度很大。帕帕喬治奧等人提出可以使用基於哈爾小波的特征而不是圖像強度^[1] 。維奧拉

和瓊斯^[2]進而提出了哈爾特征。哈爾特征使用檢測窗口中指定位置的相鄰矩形，計算每一個矩形的像素和並取其差值。然后用這些差值來對圖像的子區域進行分類。

例如，當前有一個人臉圖像集合。通過觀察可以發現，眼睛的顏色要比兩頰的深。因此，用於人臉檢測的哈爾特征是分別放置在眼睛和臉頰的兩個相鄰矩形。這些矩形的

位置則通過類似於人臉圖像的外接矩形的檢測窗口進行定義。

　　　　圖一

在維奧拉-瓊斯目標檢測框架的檢測階段，一個與目標物體同樣尺寸的檢測窗口將在輸入圖像上滑動，在圖像的每一個子區域都計算一個哈爾特征。然后這個差值會與一個預

先計算好的閾值進行比較，將目標和非目標區分開來。因為這樣的一個哈爾特征是一個弱分類器(它的檢測正確率僅僅比隨機猜測強一點點)，為了達到一個可信的判斷，就

需要一大群這樣的特征。在維奧拉-瓊斯目標檢測框架中，就會將這些哈爾特征組合成一個級聯分類器，最終形成一個強分類群。

　　哈爾特征最主要的優勢是它的計算非常快速。使用一個稱為積分圖的結構，任意尺寸的哈爾特征可以在常數時間內進行計算。

一個矩形哈爾特征可以定義為矩形中幾個區域的像素和的差值，可以具有任意的位置和尺寸。這種特質也被稱為2矩形特征（2-rectangle feature）。維奧拉和瓊斯也定義了

3矩形特征和4矩形特征。這個值表明了圖像的特定區域的某些特性。每一個特征可以描述圖像上特定特性的存在或不存在，比如邊緣或者紋理的變化。例如，一個2-矩形特征

可以表明一個邊界位於一個亮區域和一個暗區域之間。

　　維奧拉和瓊斯的一個重要貢獻是使用積分圖^[3] 。積分圖是一個二維矩形的查找表，與原始圖像具有一樣的尺寸。積分圖的每一個元素是原始圖像在對應位置左上角所有像素的和。

這就使得在任意位置計算任意尺寸的矩形的像素和時，只需要進行四次查表：

{\text{sum}}=I(C)+I(A)-I(B)-I(D).\,

其中點 $A,B,C,D$ 每個哈爾特征的查找次數取決於它的定義。維奧拉和瓊斯的2矩形特征需要六次查詢，3矩形需要八次，而4矩形則需要九次。

參考文檔：

1 https://zh.wikipedia.org/wiki/%E5%93%88%E5%B0%94%E7%89%B9%E5%BE%81

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 提取人臉68個特征點人臉識別系列之人臉檢測--訓練基於膚色特征的檢測 insightface 提取人臉特征（超簡潔）【人臉檢測——基於機器學習4】HOG特征 Facial Landmark Detection(人臉特征點檢測) 目標檢測的圖像特征提取之（二）LBP特征 PCA算法提取人臉識別特征臉（降噪）基於紋理特征的人臉活體檢測-01 基於Haar特征的Adaboost級聯人臉檢測分類器 Dlib Python 檢測人臉特征點 Face Landmark Detection