奇異值分解（SVD）與在降維中的應用

本文轉載自查看原文 2018-07-26 17:00 827 學習筆記/ ML

　　奇異值分解(Singular Value Decomposition，SVD)是在機器學習領域廣泛應用的算法，它不光可以用於降維算法中的特征分解，還可以用於推薦系統，以及自然語言處理等領域。是很多機器學習算法的基石。本文就對SVD的原理做一個總結，並討論在在PCA降維算法中是如何運用運用SVD的。

1. 特征值和特征向量

　　特征值和特征向量的定義如下：

A x = λ x

其中A是一個 n \times n

　　求出特征值和特征向量有什么好處呢？就是我們可以將矩陣A特征分解。如果我們求出了矩陣A的 $n$ $A = W Σ W^{- 1}$

　　其中W是這 $n$

　　一般我們會把W的這 $n$

　　這樣我們的特征分解表達式可以寫成： $A = W Σ W^{T}$

　　注意到要進行特征分解，矩陣A必須為方陣。那么如果A不是方陣，即行和列不相同時，我們還可以對矩陣進行分解嗎？答案是可以，此時我們的SVD登場了。

2. SVD的定義

　　SVD也是對矩陣進行分解，但是和特征分解不同，SVD並不要求要分解的矩陣為方陣。假設我們的矩陣A是一個 $m \times n$ $A = U Σ V^{T}$

　　其中U是一個 $m \times m$

　　那么我們如何求出SVD分解后的 $U, Σ, V$

　　如果我們將A的轉置和A做矩陣乘法，那么會得到 $n \times n$ $(A^{T} A) v_{i} = λ_{i} v_{i}$

　　這樣我們就可以得到矩陣 $A^{T} A$

　　如果我們將A和A的轉置做矩陣乘法，那么會得到 $m \times m$ $(A A^{T}) u_{i} = λ_{i} u_{i}$

　　這樣我們就可以得到矩陣 $A A^{T}$

　　U和V都求出來了，現在就剩下奇異值矩陣 $Σ$ 我們注意到:

A = U Σ V T \Rightarrow A V = U Σ V T V \Rightarrow A V = U Σ \Rightarrow A v i = σ i u i \Rightarrow σ i = A v i /

　這樣我們可以求出我們的每個奇異值，進而求出奇異值矩陣 $Σ$

$Σ$ 上面還有一個問題沒有講，就是我們說 $A^{T} A$ $A = U Σ V^{T} \Rightarrow A^{T} = V Σ^{T} U^{T} \Rightarrow A^{T} A = V Σ^{T} U^{T} U Σ V^{T} = V Σ^{2} V^{T}$

　　上式證明使用了: $U^{T} U = I, Σ^{T} Σ = Σ^{2} 。$

　　進一步我們還可以看出我們的特征值矩陣等於奇異值矩陣的平方，也就是說特征值和奇異值滿足如下關系： $σ_{i} = \sqrt{λ_{i}}$

　　這樣也就是說，我們可以不用 $σ_{i} = A v_{i} / u_{i}$

3. SVD的一些性質

　　上面幾節我們對SVD的定義和計算做了詳細的描述，似乎看不出我們費這么大的力氣做SVD有什么好處。那么SVD有什么重要的性質值得我們注意呢？

　　對於奇異值,它跟我們特征分解中的特征值類似，在奇異值矩陣中也是按照從大到小排列，而且奇異值的減少特別的快，在很多情況下，前10%甚至1%的奇異值的和就占了全部的奇異值之和的99%以上的比例。也就是說，我們也可以用最大的k個的奇異值和對應的左右奇異向量來近似描述矩陣。也就是說： $A_{m \times n} = U_{m \times m} Σ_{m \times n} V_{n \times n}^{T} \approx U_{m \times k} Σ_{k \times k} V_{k \times n}^{T}$ 其中k要比n小很多，也就是一個大的矩陣A可以用三個小的矩陣 $U_{m \times k}, Σ_{k \times k}, V_{k \times n}^{T}$

　　由於這個重要的性質，SVD可以用於PCA降維，來做數據壓縮和去噪。也可以用於推薦算法，將用戶和喜好對應的矩陣做特征分解，進而得到隱含的用戶需求來做推薦。同時也可以用於NLP中的算法，比如潛在語義索引（LSI）。下面我們就對SVD用於PCA降維做一個介紹。

4. SVD用於PCA

　　在主成分分析（PCA）中，要用PCA降維，需要找到樣本協方差矩陣 $X^{T} X$

　　注意到我們的SVD也可以得到協方差矩陣 $X^{T} X$

　　另一方面，注意到PCA僅僅使用了我們SVD的右奇異矩陣，沒有使用左奇異矩陣，那么左奇異矩陣有什么用呢？

　　假設我們的樣本是 $m \times n$ $X_{d \times n}^{'} = U_{d \times m}^{T} X_{m \times n}$

　　可以得到一個 $d \times n$

5. SVD小結　

　　SVD作為一個很基本的算法，在很多機器學習算法中都有它的身影，特別是在現在的大數據時代，由於SVD可以實現並行化，因此更是大展身手。SVD的原理不難，只要有基本的線性代數知識就可以理解，實現也很簡單因此值得仔細的研究。當然，SVD的缺點是分解出的矩陣解釋性往往不強，有點黑盒子的味道，不過這不影響它的使用。

文章內容轉載自：https://www.cnblogs.com/pinard/p/6251584.html

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 降維之奇異值分解(SVD) 矩陣奇異值分解(SVD)及其應用用截斷奇異值分解（Truncated SVD）降維奇異值分解（SVD）一步步教你輕松學奇異值分解SVD降維算法奇異值分解及其應用 python——矩陣的奇異值分解，對圖像進行SVD 奇異值分解（SVD）和簡單圖像壓縮自適應濾波：奇異值分解SVD 數值分析之奇異值分解(SVD)篇