2基於局部時窄特征的動作識別模哩
2.1 動作識別的基本思想
實現了基於時空興趣點和時空單詞的動作表示和識別方法,該方法首先通過訓練從樣本中提取出准確的時空興趣點,
建立基於興趣點特征的時空碼本,並構造出動作分類器。在動作識別過程中,計算待分類視頻中的興趣點特征和時空碼
本的距離對興趣點進行分類,生成對視頻動作進行表征的時空單詞,最后通過動作分類器進行分類識別。
目前已有很多方法和技術用於構造分類模型,如決策樹、神經網絡、貝葉斯方法、Fisher線性分析(Fld)以及支持向量機(Support Vector Machine, SVM)。
基於超完備字典的信號稀疏分解是一種新的信號表示理論,其采用超完備的冗余函數系統代替傳統的正交基函數,為信號自適應的稀疏擴展提供了極大的靈活性。稀疏分解可以實現數據壓縮的高效性,更重要的是可以利用字典的冗余特性捕捉信號內在的本質特征。
信號稀疏分解的基本思想是:使用超完備的冗余函數字典作為基函數,字典的選擇盡可能地符合被逼近信號的結構,字典中的元素被稱為原子。利用貪婪算法或者自適應追蹤算法,從字典中找到具有最佳線性組合的很少的幾項原子來表示一個信號,也稱作高度非線性逼近。本文主要利用字典的冗余特性可以更好地捕捉信號本質特征這一特點,提出數據分類算法SRC。實驗結果表明,SRC算法在分類准確性上優於SVM和Fld算法,不平衡數據集的分類實驗結果顯示了該算法的魯棒性。
幾個專業名詞解析:
原子:字典的列向量。
完備字典與過完背字典:如果字典D中的原子恰能夠張成n維的歐式空間,則字典D是完備的。如果m》n,字典D是冗余的,同時保證還能張成n維
的歐式空間,則大字典D是過完備的。
面對稀疏表示模型,有三個關鍵問題需要解決,如下:
1.如何有效獲取圖像在字典中下最稀疏的分解系數。2.如何設計與構建有效的圖像稀疏表示字典。3.如何將圖像稀疏表示模型應用於具體的圖像處理反問題中。
首先,Dictionary是一種sparse representation(稀疏表示)的模型。比如你的數據是y,字典是D,y=Dx,其中x是稀疏的。
如 果你的D是方陣或者長方形矩陣(正交矩陣除外),字典很可能是不確定的。相反的,如果你的D是個fat matrix 冗余矩陣,形象地講,你擁有多於必要的列來表達這個數據(冗余)。這樣的字典稱為Overcomplete dictionary。
這種字典的優勢是更有利於表達highly diversified(高度多元化)的數據(圖像)。
轉自http://blog.csdn.net/jwh_bupt/article/details/9969841
特征學習的過程中,假設學習的碼書D的大小為M。每個碼字的維數為N。每個原始特征Yi的維數也為N。假設原始特征投影到碼書上以后的特征向量是Xi(M維的矢量),那么用D和Xi對Yi重建的過程就是:Yi=D*Xi。
coding的過程就變成了已知Yi和D,求Xi的過程了。顯然這是一個非齊次方程組求解的 問題,方程組有解的條件是rank(D)≤M,其中取等號時方程組有唯一解。過完備的定義是M>>N,所以此時 rank(D)≤N<<M,此時方程組有無窮多解。(你可能會問,這和最小化平方誤差為目標函數不一樣啊!其實求個導,就變成這個方程組 了。)這就是過完備造成的問題了。怎么辦呢?辦法就是對Xi做約束------稀疏的約束,這樣Xi就有唯一解了。這就是需要加約束的原因。而為什么是稀 疏的約束,這在我前兩博客(這里和這里)中稍微介紹過,這里就不再廢話。
特征選擇的過程,也是一樣的。假設此時有n個樣本,每個樣本有個measurement(這個measurement可以是regression中的output,也可以是classification中的label)。每個樣本的特征是p維的,n個樣本的特征組成n*p的矩陣A。目標是對這p維特征做一個選擇,選擇的系數用x記錄。此時將如下圖所示:
這與第一個圖是等價的,特征選擇過程中的over-complete是指p>>n,不加約束的情況下x將有無窮多組解,所以和特征學習一樣, 加系數的約束。xi為0表示相應的特征不被選擇。(而xi<0,等價於取一個|xi|,而將相應的特征的值取負號。)
如果measurement不是一維的咋辦?比如multi-label的問題。我猜測把x的列維數也擴展成相應大小,然后根據label之間的correlation加低秩等約束吧。
轉自http://blog.csdn.net/carson2005/article/details/7989675
稀疏表示是最近幾年信號處理領域的熱點之一,簡單來說,它其實是一種對原始信號的分解過程,該分解過程借助一個事先得到的字典(也有人稱之為過完備基,overcomplete basis,后面會介紹到),將輸入信號表示為字典的線性近似的過程。即: