如何直觀地理解「協方差矩陣」?


協方差矩陣在統計學和機器學習中隨處可見,一般而言,可視作方差和協方差兩部分組成,即方差構成了對角線上的元素,協方差構成了非對角線上的元素。本文旨在從幾何角度介紹我們所熟知的協方差矩陣。

文章結構

  1. 方差和協方差的定義
  2. 從方差/協方差到協方差矩陣
  3. 多元正態分布與線性變換
  4. 協方差矩陣的特征值分解

 

1. 方差和協方差的定義

 

在統計學中,方差是用來度量單個隨機變量的離散程度,而協方差則一般用來刻畫兩個隨機變量的相似程度,其中,方差的計算公式為
[公式]
其中, [公式] 表示樣本量,符號  [公式] 表示觀測樣本的均值,這個定義在初中階段就已經開始接觸了。

 

在此基礎上,協方差的計算公式被定義為

[公式]

在公式中,符號 [公式] 分別表示兩個隨機變量所對應的觀測樣本均值,據此,我們發現:方差 [公式] 可視作隨機變量 [公式] 關於其自身的協方差 [公式] .

2. 從方差/協方差到協方差矩陣

 

根據方差的定義,給定 [公式] 個隨機變量 [公式] ,則這些隨機變量的方差為

[公式]

其中,為方便書寫, [公式] 表示隨機變量 [公式] 中的第 [公式] 個觀測樣本, [公式] 表示樣本量,每個隨機變量所對應的觀測樣本數量均為 [公式] 。

 

對於這些隨機變量,我們還可以根據協方差的定義,求出兩兩之間的協方差,即

[公式]

 

因此,協方差矩陣為

[公式]

其中,對角線上的元素為各個隨機變量的方差,非對角線上的元素為兩兩隨機變量之間的協方差,根據協方差的定義,我們可以認定:矩陣 [公式] 為對稱矩陣(symmetric matrix),其大小為 [公式] 。

3. 多元正態分布與線性變換

 

假設一個向量  [公式] 服從均值向量為  [公式] 、協方差矩陣為  [公式] 的多元正態分布(multi-variate Gaussian distribution),則
[公式]

 

令該分布的均值向量為 [公式] ,由於指數項外面的系數 [公式] 通常作為常數,故可將多元正態分布簡化為

[公式]

 

再令 [公式] ,包含兩個隨機變量 [公式] 和 [公式] ,則協方差矩陣可寫成如下形式:

[公式]

 

用單位矩陣(identity matrix) [公式] 作為協方差矩陣,隨機變量 [公式] 和 [公式] 的方差均為1,則生成如干個隨機數如圖1所示。

圖1 標准的二元正態分布

在生成的若干個隨機數中,每個點的似然為

[公式]

 

對圖1中的所有點考慮一個線性變換(linear transformation): [公式] ,我們能夠得到圖2.

圖2 經過線性變換的二元正態分布,先將圖1的縱坐標壓縮0.5倍,再將所有點逆時針旋轉30°得到。

 

在線性變換中,矩陣 [公式] 被稱為變換矩陣(transformation matrix),為了將圖1中的點經過線性變換得到我們想要的圖2,其實我們需要構造兩個矩陣:

  • 尺度矩陣(scaling matrix):

[公式]

  • 旋轉矩陣(rotation matrix)

[公式]

其中, [公式] 為順時針旋轉的度數。

 

變換矩陣、尺度矩陣和旋轉矩陣三者的關系式:
[公式]

 

在這個例子中,尺度矩陣為 [公式] ,旋轉矩陣為 [公式][公式] ,故變換矩陣為

[公式] .

 

另外,需要考慮的是,經過了線性變換, [公式] 的分布是什么樣子呢?

將 [公式] 帶入前面給出的似然 [公式] ,有

[公式]

[公式]

 

由此可以得到,多元正態分布的協方差矩陣為

[公式] [公式] .

 

4. 協方差矩陣的特征值分解

 

回到我們已經學過的線性代數內容,對於任意對稱矩陣  [公式] ,存在一個特征值分解(eigenvalue decomposition, EVD):

[公式]

其中, [公式]的每一列都是相互正交的特征向量,且是單位向量,滿足  [公式] , [公式]對角線上的元素是從大到小排列的特征值,非對角線上的元素均為0。

 

當然,這條公式在這里也可以很容易地寫成如下形式:

[公式]

其中, [公式] ,因此,通俗地說,任意一個協方差矩陣都可以視為線性變換的結果。

 

在上面的例子中,特征向量構成的矩陣為

[公式] .

特征值構成的矩陣為

[公式] .

 

到這里,我們發現:多元正態分布的概率密度是由協方差矩陣的特征向量控制旋轉(rotation),特征值控制尺度(scale),除了協方差矩陣,均值向量會控制概率密度的位置,在圖1和圖2中,均值向量為 [公式] ,因此,概率密度的中心位於坐標原點。

相關參考:

Understanding the Covariance Matrix​janakiev.com
What is the Covariance Matrix?​fouryears.eu

 

編輯於 2018-06-12


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM