Sparse PCA 稀疏主成分分析

2016-12-06 16:58:38 qilin2016 閱讀數 15677 文章標簽：統計學習算法更多

分類專欄： Machine Learning

本文鏈接： https://blog.csdn.net/zhoudi2010/article/details/53489319

SPCA原始文獻：H. Zou (2006) Sparse principal component analysis
PCA 可以參考： The Elements of Statistical Learning 第十四章
主成分分析的基本思想以及R的應用可以參考：稀疏主成分分析與R應用
關於統計學習中的稀疏算法可以參考：Statistical learning with sparsity: the lasso and generalizations
一份很好的文檔：http://www.cs.utexas.edu/~rashish/sparse_pca.pdf

首先直接來看算法：

SPCA algo

令A初始化為V[,1:k]，即為前k個principal components的loading vectors.
對於給定的 $A = [α_{1}, \dots, α_{k}]$
對於給定的 $B = [β_{1}, \dots, β_{k}]$
重復2-3步，直到收斂.
Normalization之后得到 $V_{i}$

接下來對該算法進行必要的解釋：
想要得到稀疏的結果，核心思想是在優化參數時加入 $L_{1}$

H. Zou (2006)的Theorem 1就提出了PCA和Regression的聯系。即：如果我們已經知道由SVD得到的principal components, 那么ridge estimates就是 $V_{i}$

所以新的優化問題是這樣的形式：

這里寫圖片描述

第二項和第三項是elastic net，或者理解為ridge+lasso. 第一項則和之前的形式有些不同。如果我們令 $A = B$

這一步我們遇到的問題是：
1. $A$

解決思路是：
1. 將問題轉化為：如果 $A$

先說問題2的解決方法（注釋2）：
這里寫圖片描述

令 $Y^{*} = X α_{j}$

就得到了最終需要的形式：

這里寫圖片描述

再說問題1的算法，也就是文章最開始提到的算法中的2,3步（注釋3）：

這里寫圖片描述

如此這般，SPCA就ok了！

不過，還有幾個小問題：

注釋1處為什么 $A = B$

具體可以參考The Elements of Statistical Learning 14.5

我們為了最小化reconstruction error:
$‖ x_{i} - μ - V_{q} λ_{i} ‖^{2}$

$V_{q} V_{q}^{⊤}$

所以 $A = B$

注釋2處這個轉化怎么得到的？

$‖ X - X B A^{⊤} ‖^{2}$

注意到 $A$

所以將 $‖ X - X B A^{⊤} ‖^{2}$

$‖ X - X B A^{⊤} ‖^{2}$

注釋3處 A given B 怎么證明？

需要用到Procrustes Rotation的結論：

這里寫圖片描述

(A.7)是squared Frobenius matrix norm, 所以 $‖ X ‖^{2} = t r a c e (X^{⊤} X)$

Procrustes （普洛克路斯忒斯）是希臘神話中的一名強盜。他是海神波塞冬的兒子，在從雅典到埃萊夫西納的路上開設黑店，攔截行人。店內設有一張鐵床，旅客投宿時，將身高者截斷，身矮者則強行拉長，使與床的長短相等。而由於普洛克路斯忒斯秘密地擁有兩張長度不同的床，所以無人能因身高恰好與床相等而幸免。后來英雄忒修斯前往雅典時，路過此地，將其殺死。（From Wiki）

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 PCA——主成分分析主成分分析（PCA）主成分分析 —PCA 主成分分析-PCA PCA（主成分分析）主成分分析(PCA) 主成分分析PCA（1） PCA主成分分析主成分分析（PCA）及案例分析主成分分析PCA的前世今生