核主成分分析方法(KPCA)怎么理解?


先回顧下主成分分析方法。PCA的最大方差推導的結論是,把數據投影到特征向量的方向后,方差具有極大值的。假如先把數據映射到一個新的特征空間,再做PCA會怎樣?對於一些數據,方差會更好地保留下來。而核方法就是提供了一些映射到新的特征空間的選擇。

假設這個映射為$\phi(x_{i})$, 數據從新的特征空間投影到向量w的方差,由前一節主成分分析方法可以得到

$D = w^{T}*(\frac{1}{n}\sum X^{T}*X)*w$,其中$X^{T} = [\phi(x_{1}), \phi(x_{2}), ... , \phi(x_{n})]$. 這里$X^{T}*X$矩陣是不可知的,更加無法求出它的特征向量。

但是我們知道$X*X^{T}$是一個核矩陣,每個元素可以由核函數計算出來,可以對核矩陣進行特征值分解 $X X^{T}  u = \lambda u$, 等式兩邊乘以 $X^{T}$

得到$X^{T} X (X^{T}  u) = \lambda (X^{T} u) $ ,原來兩個矩陣的特征值是一樣的!

而特征向量$X^{T} u $是不可知的,但是沒關系,我們只需要知道從新的特征空間投影回來的坐標就可以了。

先把$X^{T} u $單位化為v,很容易推導出它的長度為$\sqrt{\lambda}$, 那么投影后的坐標為

$v^{T}*\phi(x^{'}) = \frac{1}{\sqrt{\lambda}} uX\phi(x^{'})$, 是可以用核函數求出來的,於是用核方法降維后的點就算出來的。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM