協方差與協方差矩陣


協方差是統計學上表示兩個隨機變量之間的相關性,隨機變量ξ的離差與隨機變量η的離差的乘積的數學期望叫做隨機變量ξ與η的協方差(也叫相關矩),記作cov(ξ, η):

cov(ξ, η) = E[(ξ-Eξ)(η-Eη)] = E(ξη)-EξEη

對於離散隨機變量,我們有:

對於連續隨機變量,我們有:

隨機變量的協方差用來描述隨機變量之間的相關性,如果ξ與η獨立,則cov(ξ, η)=0. 如果ξ與η相同,則cov(ξ, η)就是變量ξ的方差.


協方差矩陣是一個矩陣,其每個元素是各個矢量元素之間的協方差。這是從標量隨機變量到高維度隨機矢量的自然推廣.

假設X是以n個標量隨機變量組成的列矢量,

X = \begin{bmatrix}X_1 \\  \vdots \\ X_n \end{bmatrix}

並且\mu_i是其第i個元素的期望值,即, \mu_i = \mathrm{E}(X_i)。協方差矩陣被定義的第i,j項是如下:

\Sigma_{ij}
= \mathrm{cov}(X_i, X_j) = \mathrm{E}\begin{bmatrix}
(X_i - \mu_i)(X_j - \mu_j)
\end{bmatrix}

即:

\Sigma=\mathrm{E}
\left[
 \left(
 \textbf{X} - \mathrm{E}[\textbf{X}]
 \right)
 \left(
 \textbf{X} - \mathrm{E}[\textbf{X}]
 \right)^\top
\right]
=
\begin{bmatrix}
 \mathrm{E}[(X_1 - \mu_1)(X_1 - \mu_1)] & \mathrm{E}[(X_1 - \mu_1)(X_2 - \mu_2)] & \cdots & \mathrm{E}[(X_1 - \mu_1)(X_n - \mu_n)] \\ \\
 \mathrm{E}[(X_2 - \mu_2)(X_1 - \mu_1)] & \mathrm{E}[(X_2 - \mu_2)(X_2 - \mu_2)] & \cdots & \mathrm{E}[(X_2 - \mu_2)(X_n - \mu_n)] \\ \\
 \vdots & \vdots & \ddots & \vdots \\ \\
 \mathrm{E}[(X_n - \mu_n)(X_1 - \mu_1)] & \mathrm{E}[(X_n - \mu_n)(X_2 - \mu_2)] & \cdots & \mathrm{E}[(X_n - \mu_n)(X_n - \mu_n)]
\end{bmatrix}

矩陣中的第(i,j)個元素是X_iX_j的協方差。這個概念是對於標量隨機變量方差的一般化推廣。


進一步的分析協方差矩陣

表示各樣本的Xi變量不同樣本值組成的向量(i=1,2,...n);

β表示某一個樣本 j 的各變量值組成的向量(j=1,2,...,m);

用 μ表示Xi的期望,即 μ=E(Xi).

\Sigma_{ij}
= \mathrm{cov}(X_i, X_j) = \mathrm{E}\begin{bmatrix}
(X_i - \mu_i)(X_j - \mu_j)
\end{bmatrix}

協方差矩陣為 

 

 如果所有μ=E(Xi)=0.則上面表達式就變為:

(實際計算中,分母是m-1,而不用m)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM