線性代數之——矩陣范數和條件數


1. 矩陣范數

我們怎么來衡量一個矩陣的大小呢?針對一個向量,它的長度是 \(||\boldsymbol x||\)。針對一個矩陣,它的范數是 \(||A||\)。有時候我們會用向量的范數來替代長度這個說法,但對於矩陣我們只說范數。有很多方式來定義矩陣的范數,我們來看看所有范數的的要求然后選擇其中一個。

Frobenius 對矩陣中的所有元素進行平方 \(|a_{ij}|^2\) 再相加,然后 \(||A||_F\) 就是它的平方根。這就像把矩陣看作是一個很長的有 \(n^2\) 個元素的向量,這有時候會很有用,但這里我們不選擇它。

向量范數滿足三角不等式,即 $||\boldsymbol x+\boldsymbol y|| $ 不大於 $||\boldsymbol x|| + ||\boldsymbol y|| $, \(2\boldsymbol x\) 或者 \(-2\boldsymbol x\) 的長度變為兩倍。同樣的規則也應用於矩陣的范數:

第二個對矩陣范數的要求是新的,因為矩陣可以相乘。范數 \(||A||\) 控制着從 \(\boldsymbol x\)\(A\boldsymbol x\) 和從 \(A\)\(B\) 的增長。

根據此,我們可以這樣定義矩陣的范數:

恆等矩陣的范數為 1,針對一個正交矩陣,我們有 \(||Q\boldsymbol x||=||\boldsymbol x||\),所以正交矩陣的范數也為 1。

針對正定的對稱矩陣,\(||A||=\lambda_{max}(A)\)

將矩陣分解成 \(A=Q\Lambda Q^T\),左右兩邊的正交矩陣保持向量的長度不變,因此 \(||A\boldsymbol x||/||\boldsymbol x||\) 的最大值就是對角陣中的最大特征值。對於一個對稱矩陣,我們仍然可以得到上面的分解,只不過此時的特征值不能保證一定是正數,矩陣的范數變為了特征值絕對值的最大值。

對於不對稱的矩陣,它的特征值不能衡量矩陣真正的大小,范數可以比所有特征值都大。

對於上面的例子,\(\boldsymbol x=(0, 1)\) 是對稱矩陣 \(A^TA\) 的特征向量,事實上矩陣的范數是由 \(A^TA\) 的最大特征值決定的。

矩陣的范數是 \(A^TA\) 最大特征值的平方根,也就是矩陣的最大奇異值。

2. 條件數

有些系統對誤差很敏感,有些則不是那么敏感,對誤差的靈敏度我們用條件數來衡量。

原始的方程為 \(A\boldsymbol x=\boldsymbol b\),假設方程右邊由於測量誤差被改變為了 \(\boldsymbol b+\Delta \boldsymbol b\),那么我們的解就變成了 \(\boldsymbol x+\Delta \boldsymbol x\),我們的目標是估計 \(\Delta \boldsymbol b\) 是怎么影響 \(\Delta \boldsymbol x\) 的。

\[A(\boldsymbol x+ \Delta \boldsymbol x)=\boldsymbol b+\Delta \boldsymbol b \to A \Delta \boldsymbol x=\Delta \boldsymbol b \to \Delta \boldsymbol x=A^{-1}\Delta \boldsymbol b \]

如果 \(A^{-1}\) 很大的話,此時矩陣接近於奇異,\(\Delta \boldsymbol x\) 就會很大。\(\Delta \boldsymbol x\) 還會變得特別大如果 \(\Delta \boldsymbol b\) 在錯誤的方向,因為它會被 \(A^{-1}\) 放大。最大的誤差為 \(||\Delta \boldsymbol x||=||A^{-1}|| \space ||\Delta \boldsymbol b||\)

但這樣會有一個問題,當我們改變 \(A\) 的話,方程的解 \(\boldsymbol x\)\(\Delta \boldsymbol x\) 都會同時改變,相對誤差 \(||\Delta \boldsymbol x|| / ||\boldsymbol x||\) 卻保持不變。事實上,應該是解 \(\boldsymbol x\) 的相對誤差和 \(\boldsymbol b\) 的誤差相比較,條件數 \(c=||A|| \space ||A^{-1}||\) 衡量了方程 \(A\boldsymbol x=\boldsymbol b\) 的靈敏度。

  • 證明

\[\tag{1}A \boldsymbol x=\boldsymbol b \to ||\boldsymbol b|| \leqslant ||A|| \space ||\boldsymbol x|| \]

\[\tag{2}\Delta \boldsymbol x=A^{-1}\Delta \boldsymbol b \to ||\Delta \boldsymbol x|| \leqslant ||A^{-1}|| \space ||\Delta \boldsymbol b|| \]

(1) 式和 (2) 式相乘,可得,

\[\tag{3} ||\boldsymbol b|| \space ||\Delta \boldsymbol x|| \leqslant ||A|| \space ||A^{-1}|| \space ||\boldsymbol x|| \space ||\Delta \boldsymbol b|| \]

上式兩邊同時除以 \(||\boldsymbol b|| \space ||\boldsymbol x||\) 可得,

\[\tag{4}\frac{ ||\Delta \boldsymbol x||}{||\boldsymbol x||} \leqslant ||A|| \space ||A^{-1}|| \space \frac{\space ||\Delta \boldsymbol b||}{||\boldsymbol b||}=c\frac{\space ||\Delta \boldsymbol b||}{||\boldsymbol b||} \]

同理可得,

此外,對於正定矩陣,條件數來自於它的特征值。

獲取更多精彩,請關注「seniusen」!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM