Dlib庫landmark算法解析(ERT 集成回歸樹)


 landmark是一種人臉部特征點提取的技術,Dlib庫中為人臉68點標記,在《調用Dlib庫進行人臉關鍵點標記》一文中有效果和標定點序號的示意圖。今后可采用landmark中的點提取眼睛區域、嘴巴區域用於疲勞檢測,提取鼻子等部分可用於3D姿態估計。

      Dlib庫使用《One Millisecond Face Alignment with an Ensemble of Regression Trees》CVPR2014中提及的算法:ERT(ensemble of regression trees)級聯回歸,即基於梯度提高學習的回歸樹方法。該算法使用級聯回歸因子,首先需要使用一系列標定好的人臉圖片作為訓練集,然后會生成一個模型

      the shape_predictor_trainer object to train a shape_predictor using a set of training images, each annotated with shapes you want to predict. To do this, the shape_predictor_trainer uses the state-of-the-art method.

      使用基於特征選擇的相關性方法把目標輸出ri投影到一個隨機方向w上,並且選擇一對特征(u,v),使得Ii(u’)-Ii(v’)與被投影的目標wTri在訓練數據上擁有最高的樣本相關性。

      當獲得一張圖片后,算法會生成一個initial shape就是首先估計一個大致的特征點位置,然后采用gradient boosting算法減小initial shape 和 ground truth 的平方誤差總和。用最小二乘法來最小化誤差,得到每一級的級聯回歸因子。核心公式如下圖所示:

 


算法核心公式
      我們使用梯度提高學習的回歸樹訓練每個rt,使用最小二乘法最小化誤差。t表示級聯序號,rt(∙,∙)表示當前級的回歸器regressor。回歸器的輸入參數為圖像I和上一級回歸器更新后的shape,采用的特征可以是灰度值或者其它。每個回歸器由很多棵樹(tree)組成,每棵樹參數是根據current shape和ground truth的坐標差和隨機挑選的像素對訓練得到的。

        與LBF不同,ERT是在學習Tree的過程中,直接將shape的更新值ΔS存入葉子結點leaf node.初始位置S在通過所有學習到的Tree后,meanshape加上所有經過的葉子結點的ΔS,即可得到最終的人臉關鍵點位置。總體流程如下圖所示:

 


回歸過程,最小化誤差
附:人臉特征提取算法比較(ASM、CLM、ERT等 )請參考如下博客:

http://blog.csdn.net/u013803245/article/details/51263808
————————————————
版權聲明:本文為CSDN博主「zzyy0929」的原創文章,遵循CC 4.0 BY-SA版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/zzyy0929/article/details/78323256


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM