正定矩陣與半正定矩陣


在眾多的機器學習模型中,線性代數的身影無處不在,當然,我們也會時常碰到線性代數中的正定矩陣和半正定矩陣。例如,多元正態分布的協方差矩陣要求是半正定的。



 

1. 基本的定義

正定和半正定這兩個詞的英文分別是positive definite和positive semi-definite,其中,definite是一個形容詞,表示“明確的、確定的”等意思。

初學線性代數的讀者可能會被這兩個詞“唬住”,但正定矩陣和半正定矩陣的定義實際上是很簡單的 (不考慮復數構成的矩陣):

【定義1】給定一個大小為  [公式] 的實對稱矩陣  [公式] ,若對於任意長度為  [公式] 的非零向量  [公式] ,有  [公式] 恆成立,則矩陣  [公式] 是一個正定矩陣。

【例1】單位矩陣 [公式] 是否是正定矩陣?

解:設向量 [公式] 為非零向量,則

[公式]

由於 [公式] ,故 [公式] 恆成立,即單位矩陣 [公式] 是正定矩陣。

單位矩陣是正定矩陣 (positive definite)。

【簡單證明】對於任意單位矩陣 [公式] 而言,給定任意非零向量 [公式] ,恆有

[公式]

[公式]

【例2】 實對稱矩陣 [公式] 是否是正定矩陣?

解:設向量 [公式] 為非零向量,則

[公式]

[公式]

因此,矩陣 [公式] 是正定矩陣。

【定義2】給定一個大小為  [公式] 的實對稱矩陣  [公式] ,若對於任意長度為  [公式] 的向量  [公式] ,有  [公式] 恆成立,則矩陣  [公式] 是一個半正定矩陣。

根據正定矩陣和半正定矩陣的定義,我們也會發現:半正定矩陣包括了正定矩陣,與非負實數 (non-negative real number)和正實數 (positive real number)之間的關系很像。

圖1 正實數與負實數,圖片來源於https://en.wikipedia.org/wiki/Real_number

2. 從二次函數到正定/半正定矩陣

在初中數學中,我們學習了二次函數 [公式] ,該函數的曲線會經過坐標原點,當參數 [公式]時,曲線的“開口”向上,參數 [公式] 時,曲線的“開口”向下。

以 [公式] 為例,曲線如下:

圖2 二次函數曲線

實際上,我們可以將 [公式] 視作 [公式] 的多維表達式。

當我們希望 [公式] 對於任意向量 [公式] 都恆成立,就要求矩陣 [公式] 是一個半正定矩陣,對應於二次函數, [公式] 需要使得 [公式] .

另外,在 [公式] 中,我們還知道:若 [公式] ,則對於任意 [公式] ,有 [公式] 恆成立。

這在 [公式] 也有契合之處,當矩陣 [公式] 是正定矩陣時,對於任意 [公式] , [公式] 恆成立。

3. 正定矩陣和半正定矩陣的直觀解釋

若給定任意一個正定矩陣  [公式] 和一個非零向量  [公式] ,則兩者相乘得到的向量  [公式] 與向量  [公式] 的夾角恆小於  [公式] . (等價於:  [公式] .)

【例3】給定向量 [公式] ,對於單位矩陣 [公式] ,則

[公式]

向量 [公式] 之間的夾角為

[公式]

[公式]

[公式]

即兩個向量之間的夾角為0°.

【例4】給定向量 [公式] ,對於實對稱矩陣 [公式] ,則

[公式]

向量 [公式] 之間的夾角為

[公式]

即兩個向量之間的夾角小於 [公式] .

若給定任意一個半正定矩陣  [公式] 和一個向量  [公式] ,則兩者相乘得到的向量  [公式] 與向量  [公式] 的夾角恆小於或等於  [公式] . (等價於:  [公式] .)

3. 為什么協方差矩陣要是半正定的?

在概率論與數理統計中,我們都學習的協方差矩陣的定義:

對於任意多元隨機變量  [公式] ,協方差矩陣為
[公式]

現給定任意一個向量 [公式] ,則

[公式]

[公式]

[公式]

其中,

[公式]

由於 [公式] ,因此, [公式] ,協方差矩陣 [公式] 是半正定的。

 

注:原文搬運自知乎:https://zhuanlan.zhihu.com/p/44860862


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM