K-L變換和主成分分析PCA

本文轉載自查看原文 2016-12-31 17:42 2190 機器學習 Machine learning/ 圖像處理算法/ 數字信號處理

一.K-L變換

說PCA的話，必須先介紹一下K-L變換了。

K-L變換是Karhunen-Loeve變換的簡稱，是一種特殊的正交變換。它是建立在統計特性基礎上的一種變換，有的文獻也稱其為霍特林（Hotelling）變換，因為他在1933年最先給出將離散信號變換成一串不相關系數的方法。
K-L變換的突出優點是它能去相關性，而且是均方誤差（Mean Square Error，MSE）意義下的最佳變換。

下面就簡單的介紹一下K-L變換了。

設，隨機向量X ∈Rⁿ(n階列向量)，它的均值向量為m_X，則其協方差矩陣可以表示為

C_x= E{(X-m_x)*(X-m_x)^T}                           （2.1）

C_x是一個n*n階的實對稱陣。

K-L變換定義了一正交變換A ∈R^n*n，將X ∈Rⁿ的向量映射到用Y ∈Rⁿ代表的向量，並且使Y向量中各分量間不相關：
Y = A*(X-m_x)                                            （2.2）

因為Y的各分量間不相關，則其協方差矩陣C_y為對角陣，即

C_y = diag(λ₁,λ₂,...,λ_n)

而矩陣A總是可以找到的，因為對於實對稱陣，總能找到一個正交陣A，使得AC_xA^T的運算結果為對稱陣。K-L變換中，將A的每一行取為C_x的特征向量，並且將這些特征向量按對應的特征值大小進行降序排序，使最大特征值對應的特征向量在A的第一行，而最小特征值對應的特征向量在A的最后一行。而C_y是C_x對角化后的結果，所以兩個矩陣的特征值是一致的（λ₁,λ₂,...,λ_n）。

這樣就可以通過矩陣A實現由隨機向量X到隨機向量Y的K-L變換了，而由

X = A^TY +m_x （2.3）

就可以實現Y反變換到X。
若選擇的最大k個特征值對應的k個特征向量，組成k×n的轉換矩陣A，則變換后Y降為k維的，則由Y對X的恢復公式如下：

X‘ = A^KY +m_x   （2.4）

這時候C_y = diag(λ₁,λ₂,...,λ_k)，X與X’之間的均方誤差可以由下式表達：

λ_k+1+.λ_k+2...+λ_n                                       （2.5）                            （沒有公式編輯器啊）

上面我們提到了對於特征值λ是從大到小排序的，那么這時候通過式子2.5可以表明通過選擇k個具有最大特征值的特征向量來降低誤差。因此，從可以將向量X和它的近似X‘之間的均方誤差降至最小這方面來說，K-L變換是最佳變換。

二.PCA，主成分分析

在二十世紀九十年代初，Kirby和Sirovich開始討論利用PCA技術進行人臉圖像的最優表示問題。並且由M.Turk和A.Pentland將此技術用於人臉識別中，並稱為特征臉方法。M.Turk和A.Pentland將m×n的人臉圖像，重新排列為m *n維的列向量。則所有的訓練圖像經此變換后得到一組列向量：{ x_i }，x_i∈R^m*n，其中N代表訓練樣本集中圖像的個數。將圖像看成一隨機列向量，並通過訓練樣本對其均值向量和協方差矩陣進行估計。

均值向量μ通過下式估計：
μ = (1/N)*((x₁+x₂+...+x_N)                        （3.1）
協方差矩陣

S_T= E{(x_i-u)*(x_i-u)^T} = X'X'^T               （3.2）

其中X’ = [x₁-μ, x₂-μ,...., x_N-μ]

則將投影變換矩陣A取為ST的前k個最大特征值對應的特征向量。利用K-L變換式對原圖像進行去相關並降維：

Y = A_K*(X-m_x)                                          （3.3）

因為S_T=X'X'^T，而X‘為（m*n）*N矩陣，但是因為X’為N階矩陣，所以S_T的秩最大為N-1，這樣只要計算出S_T的特征向量就可以計算出K-L變換矩陣了。

但是因為S_T是（m*n）*(m*n)階的矩陣，所以計算它的特征向量比較復雜，這里使用了一個技巧：

X^TXv_i=δ_iv_i                                                （3.4）

(XX^T)(Xv_i)=δ_i(Xv_i)                                    （3.5）

根據式子3.4與3.5可以看出，只要計算出X^TX的特征值和特征向量δ_i與v_i，然后就可以計算出XX^T的特征值和特征向量δ_i與Xv_i，而X^TX為N*N階的矩陣，計算起來比較容易，除此以外，也可以使用SVD，這里就不提了。

三.PCA流程整理

PCA的整個變換過程整理了一下，如下：

1.將mxn的訓練圖像重新排列為m *n維的列向量。計算均值向量，並利用均值向量將所有樣本中心化。
2.利用中心化后的樣本向量，根據式（3.2）計算其協方差矩陣；對其特征值分解，並將特征向量按其對應的特征值大小進行降序排列。
3.選取第2步所得的k ≤N-1個最大特征值對應的特征向量組成投影矩陣A，將每幅已中心化的訓練圖像(x₁-μ, x₂-μ,...., x_N-μ)，向矩陣A投影，得到每幅訓練圖像的降維表示為(y₁-μ, y₂-μ,...., y_N)
4.對測試圖像中心化，並投影到矩陣A，得到測試圖像的降維表示。
5.選擇合適的分類器，對測試圖像進行分類。

reference：主成分分析PCA（Principal Component Analysis）介紹

PCA本質和SVD

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 主成分分析（PCA）算法，K-L變換角度主成分分析法（離散K-L變換）基變換、線性變換與pca主成分分析 PCA——主成分分析主成分分析（PCA）主成分分析 —PCA 主成分分析-PCA PCA（主成分分析）主成分分析(PCA) 主成分分析PCA（1）

K-L變換和 主成分分析PCA

一.K-L變換

二.PCA，主成分分析

三.PCA流程整理

免責聲明！

K-L變換和主成分分析PCA