《人臉識別與人體動作識別技術及應用》


人臉識別與人體動作識別技術及應用
曹林 2015/8/1 電子工業出版社

一、緒論
1、國內外人臉庫介紹:
1)、FERET人臉數據庫:美軍建立,在不同姿態、表情、光照條件下采集,西方人構成,人種單一
2)、CMU-PIE人臉數據庫:美卡梅隆大學建立,對姿態光照進行了嚴格控制
3)、YALE人臉數據庫:耶魯大學建立,15名志願者
4)、OLR人臉數據庫:劍橋大學AT&T實驗室建立,常用研究數據庫之一
5)、MIt人臉數據庫:麻省理工大學建立,16名志願者
6)、CAS-PEAL人臉數據庫:中科院建立,對應不同表情、光照、年齡、飾物等條件下
7)、BJUT—3D 3D人臉數據庫:北京工業大學建立
8)、CHUK素描人臉數據庫:香港大學建立

2、對人臉識別技術的影響的因素:
光照: 
解決辦法:a、通過算法進行光照補償處理,成本低但效果不好
b 、通過外部條件補光,效果好,成本大
姿態:
解決辦法:a、加入其他類型姿態的人臉,比較麻煩
b 采用3D人臉,可旋轉改變姿態
目標圖像的分辨率:(分辨率高保留圖像的信息高)
解決辦法: a、增強監控設備
b利用圖像超分辨率算法重建

3、圖像超分辨率的介紹:
利用軟件的方法將一幅或多幅低分辨率的圖像重建成一幅高分辨率的圖像
應用前景:
公共安全領域、醫療圖像領域、衛星遙感圖像領域、軍事應用領域、數字電視領域、歷史以及人文照片的復原
發展前景:
證件識別(護照等。。。)、刑偵破案、重要地方的監控系統、高清視頻會議、人臉表情分析

4、低分辨率圖像退化模型
退化模型:L(k)=DB(k)M(k)*H+n(k) (k是下標)

組成:運動形變、模糊、下采樣、噪聲
運動形變:實景與設備之間的相對運動
模糊:主要影響伊因素是光照
下采樣:下采樣會丟失圖像部分信息
噪聲:噪聲對人的影響噪聲可以理解為“ 妨礙人們感覺器官對所接收的信源信息理解的因素”。而圖像中各種妨礙人們對其信息接受的因素即可稱為圖像噪聲 。

5、計算機視覺技術
目的:讓計算機能對外界獲取的信息進行智能化的分析與處理,模擬人腦功能
用途:提高視頻監控、安防系統等智能化程度,以便充分發揮視頻監控系統的主動監督作用、及時報警預防安全事故發生

6、人體行為視頻數據庫
Weizmann人體行為數據庫:以色列科學院采集,在背景、拍攝角度不變情況下,采集10種不同動作

KThan人體行為數據庫:瑞典皇家理工學院采集,背景相對靜止,鏡頭有拉近、遠的操作,采集6種不同動作

中科院人體行為數據庫:中科院建立,拍攝角度為斜視、俯視、平視,包含單人以及多人交互行為,8中單人行為,多人交互行為有劫持、打架等

二、人臉圖像配准和人臉檢測跟蹤
1、人臉配准
定義:將人臉圖像分辨率變為一致,各個關鍵特征部位的坐標盡量接近

2D人臉配准:(信息量少,特征點不多,配准比較容易,算法也比較成熟)
手動標定:直接手動操作得到各個特征點坐標再使用線性變換得到配准
利用人眼檢測手段:尋找圖像特征點再進行配准 (人眼濾波器)
兩者之間:少量人眼檢測需要進行手動校正:

3D人臉配准:
除了顏色信息、位置信息,3D人臉配准還多了深度
將3D轉化為2D圖像處理:

步驟:
1、獲取紋理圖像:將3D圖像投射到XOY平面
2、檢測特征點:利用人眼濾波器找到人眼位置,使用邊緣檢測找到人臉的大概位置
3、細化特征點位置:算法:ASM算法、VOSM算法(ASM算法的改進)
ASM算法原理:先建立形狀模型、在局部灰度模型、后獲得局部灰度特征模板

2、人臉檢測
指對輸入的視頻或圖片中,確認是否有人臉的存在,若有則將人臉位置框出的過程,各個類型的人臉種類越多,人臉檢測算法的魯棒性越好

人臉檢測的兩大類:非學習檢測方法與學習檢測方法
非學習檢測方法:針對人臉的形狀、膚色已經運動軌跡等進行檢測(算法:Gobor圖形檢測,膚色檢測),檢測率不理想
學習檢測方法:即機器學習的方法,
又可分為2類:非監督學習(錯誤與正確分類樣本不予區分)
監督學習(在下一輪學習中會更多注意上一輪錯分的樣本)

** 機器學習的方法過程:**
1、將樣本分類(正負樣本)
2、以某個樣本的特征進行分類,得到分類器
3、對各類特征進行循環處理,對特征進行組合,直到得到最好檢測率,得到最終分類器

人臉檢測的重要算法:
神經網絡、支持向量機(SVM)、AdaBoost算法
神經網絡:
支持向量機(SVM):
AdaBoost算法:


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM