Hermite 矩陣及其特征刻畫


將學習到什么

矩陣 \(A\)\(\dfrac{1}{2}(A+A^T)\) 兩者生成相同的二次型,而后面那個矩陣是對稱的,這樣以來,為了研究實的或者復的二次型,就只需要研究由對稱矩陣生成的二次型.

 


基本概念

  定義1: 矩陣 \(A=[a_{ij}] \in M_n\) 稱為 Hermite 的,如果 \(A=A^*\);它是斜 Hermite 的,如果 \(A=-A^*\).

對於 \(A,B \in M_n\),可得出很多簡單明了的結論:
  (1) \(A+A^*\), \(AA^*\) 以及 \(A^*A\) 都是 Hermite 的
  (2) 如果 \(A\) 是 Hermite 的,那么對所有 \(k=1,2,3,\cdots\), \(A^k\) 都是 Hermite 的. 如果 \(A\) 還是非奇異的,那么 \(A^{-1}\) 是 Hermite 的
  (3) \(A-A^*\) 是斜 Hermite 的
  (4) 如果 \(A\) 是 Hermite 的,那么 \(\mathrm{i}A\) 是斜 Hermite 的;如果 \(A\) 是斜 Hermite 的,那么 \(\mathrm{i}A\) 是 Hermite 的
  (5) \(A=\dfrac{1}{2}(A+A^*)+\dfrac{1}{2}(A-A^*)=H(A)+S(A)=H(A)+\mathrm{i}K(A)\), 其中 \(H(A)=\dfrac{1}{2}(A+A^*)\)\(A\)Hermite 部分\(S(A)=\dfrac{1}{2}(A-A^*)\)\(A\)斜 Hermite 部分,而 \(K(A)=\dfrac{1}{2\mathrm{i}}(A-A^*)\)
  (6) 如果 \(A=C+\mathrm{i}D\), 其中 \(C,D \in M_n(\mathbb{R})\)\(A\) 的實部與虛部),那么 \(A\) 是 Hermite 的,當且僅當 \(C\) 是對稱的,且 \(D\) 是斜對稱的
  (7) 實對稱矩陣是復的 Hermite 矩陣

 
  定理1:(Toeplitz 分解) 每個 \(A\in M_n\) 都可以用唯一的方式寫成 \(A=H+\mathrm{i}K\), 其中 \(H\)\(K\) 兩者都是 Hermite 矩陣. 它還可以用唯一的方式寫成 \(A=H+S\),其中 \(H\) 是 Hermite 的,且 \(S\) 是斜 Hermite 的
 
  證明:由上述結論中第 (5) 條即可得出. 至於唯一性,如果令 \(A=E+\mathrm{i}F\), 其中 \(E\)\(F\) 皆為 Hermite 的,那么
\begin{align}
2H=A+A^*=(E+\mathrm{i}F)+(E+\mathrm{i}F)^*=E+\mathrm{i}F+E^*-\mathrm{i}F^*=2E
\end{align}
所以 \(E=H\). 類似地有 \(F=K\).
 
前述結論提示我們,誠如每個復數 \(z\) 可以唯一地寫成 \(z=s+\mathrm{i} t\) 一樣(其中 \(s,t \in \mathbb{R}\)), 每一個復矩陣也可以用唯一的方式寫成 \(A=H+\mathrm{i}K\)(其中 \(H\)\(K\) 是 Hermite 矩陣). 還有一些進一步的性質強化了這種類似.
 
  定理2:\(A\in M_n\) 是 Hermite 的. 那么
  (a) \(x^*Ax\) 對所有 \(x \in \mathbb{C}^n\) 都是實的.
  (b) \(A\) 的特征值都是實的
  (c) 對所有 \(S \in M_n\), \(S^*AS\) 都是 Hermite 的
 
  定理3: 設給定 \(A=[a_{ij}]\in M_n\). 那么 \(A\) 是 Hermite 的,當且僅當以下諸條件中至少一條滿足:
  (a) 對所有 \(x \in \mathbb{C}^n\), \(x^*Ax\) 都是實的
  (b) \(A\) 是正規的且有實的特征值
  (c) 對所有 \(S \in M_n\), \(S^*AS\) 都是 Hermite 的
 
  證明:必要性由定理 2 說明,只需證明充分性。
(a) 如果對所有 \(x \in \mathbb{C}^n\), \(x^*Ax\) 都是實的,那么對所有 $x,y\in \mathbb{C}^n $, \((x+y)^*A(x+y)=(x^*Ax+y^*Ay)+(x^*Ay+y^*Ax)\) 是實的. 由於根據假設 \(x^*Ax\)\(y^*Ay\) 是實的,我們就斷定:對所有 $x,y\in \mathbb{C}^n $, \(x^*Ay+y^*Ax\) 是實的. 如果我們選取 \(x=e_k\) 以及 \(y=e_j\), 那么 \(x^*Ay+y^*Ax=a_{kj}+a_{jk}\) 是實的,所以 \(\mathrm{Im} \,a_{kj}=-\mathrm{Im} \,a_{jk}\). 如果我們選取 \(x=\mathrm{i} e_k\) 以及 \(y=e_j\), 那么 \(x^*Ay+y^*Ax=-\mathrm{i}a_{kj}+\mathrm{i}a_{jk}\) 是實的,所以 \(\mathrm{Re} \,a_{kj}=\mathrm{Re} \,a_{jk}\). 所以 \(a_{kj}=\bar{a}_{jk}\), 又因為 \(j,k\) 是任意的,我們就得出結論 \(A=A^*\).
(b) 如果 \(A\) 是正規的,那么可以酉對角化,所以 \(A=U\Lambda U^*\), 其中 \(\Lambda=\mathrm{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)\). 一般來說,我們有 \(A^*=U\bar{\Lambda} U^*\), 但如果 \(\Lambda\) 是實的,我們就有 \(A^*=U\Lambda U^*=A\).
(c) 條件 (c) 蘊含 \(A\) 是 Hermite 的(選取 \(S=I\)
 
由於 Hermite 矩陣都是正規的,所以有關正規矩陣的所有結果都適用於 Hermite 矩陣. 例如,與不同特征值相伴的特征向量是正交的,存在一組由特征向量組成的標准正交基以及 Hermite 矩陣可以酉對角化.下面復述關於 Hermite 矩陣的譜定理.
 
  定理4: 矩陣 \(A \in M_n\) 是 Hermite 的,當且僅當存在一個酉矩陣 \(U \in M_n\) 以及一個實的對角矩陣 \(\Lambda \in M_n\), 使得 \(A=U\Lambda U^*\). 此外, \(A\) 是實的 Hermite 矩陣(即實對稱矩陣),當且僅當存在一個實正交矩陣 \(P \in M_n\) 以及一個實對角矩陣 \(\Lambda \in M_n\), 使得 \(A=P\Lambda P^T\).
 
盡管 Hermite 矩陣的實線性組合恆為 Hermite 矩陣,但是 Hermite 矩陣的復線性組合不一定是 Hermite 矩陣. 此外,如果 \(A\)\(B\) 是 Hermite 矩陣,那么 \((AB)^*=B^*A^*=BA\), 所以 \(AB\) 是 Hermite 矩陣,當且僅當 \(A\)\(B\) 可交換.
關於可交換的 Hermite 矩陣的一個最有名的結果如下:
 
  定理5:\(\mathcal{F}\) 是一個給定的非空的 Hermite 矩陣族. 則存在一個酉矩陣 \(U\) 使得對所有 \(A \in \mathcal{F}\), \(UAU^*\) 都是對角矩陣的充分必要條件是,對所有 \(A,B \in \mathcal{F}\) 都有 \(AB=BA\).
 

推廣

對於 Hermite 矩陣 \(A\)\(A=A^*\), 推廣這一概念的一種方法是考慮使得 \(A\) 相似於 \(A^*\) 的矩陣類. 如下的定理拓廣了推論1,並用若干種方式刻畫了這個矩陣類的特征.
 
  定理6: 設給定 \(A \in M_n\), 則如下諸命題等價:
  (a) \(A\) 與一個實矩陣相似
  (b) \(A\)\(A^*\) 相似
  (c) \(A\) 通過一個 Hermite 相似變換與 \(A^*\) 相似
  (d) \(A=HK\), 其中 \(H,K \in M_n\) 是 Hermite 矩陣,且至少有一個因子是非奇異的
  (e) \(A=HK\), 其中 \(H,K \in M_n\) 是 Hermite 矩陣
 
  證明:首先注意 (a) 與 (b) 是等價的:每一個復矩陣都與它的轉置相似,所以,\(A\) 相似於 \(A^*=\bar{A}^T\) 當且僅當 \(A\) 相似於 \(\bar{A}\), 當且僅當 \(A\) 相似於一個實矩陣.
為驗證 (b) 蘊含 (c),假設存在一個非奇異的 \(S \in M_n\), 使得 \(S^{-1}AS=A^*\). 設 \(\theta \in \mathbb{R}\), 並令 \(T=\mathrm{e}^{\mathrm{i}\theta} S\). 注意到 \(T^{-1}AT=A^*\), 這樣一來,就有 \(AT=TA^*\) 或者 \(AT^*=T^*A^*\). 將這兩個等式相加就得到 \(A(T+T^*)=(T+T^*)A^*\). 如果 \(T+T^*\) 是非奇異的,我們就能斷言 \(A\)\(A^*\) 通過 Hermite 矩陣 \(T+T^*\) 而相似,所以就只需要證明存在某個 \(\theta\), 使得 \(T+T^*\) 是非奇異的. 矩陣 \(T+T^*\) 是非奇異的,漢且僅當 \(T^{-1}(T+T^*)=I+T^{-1}T^*\) 是非奇異的,當且僅當 \(-1 \notin \sigma(T^{-1}T^*)\). 但是 \(T^{-1}T^*=\mathrm{e}^{-2\mathrm{i}\theta} S^{-1}S^*\), 所以我們可以選取滿足 \(-\mathrm{e}^{-2\mathrm{i}\theta} \notin \sigma(S^{-1}S^*)\) 的任何 \(\theta\).
現在假設 (c) 成立,並記 \(R^{-1}AR=A^*\), 其中 \(R \in M_n\) 是非奇異的 Hermite 矩陣. 那么 \(R^{-1}A=A^*R^{-1}\)\(A=R(A^*R^{-1})\). 但是 \((A^*R^{-1})^*=R^{-1}A=A^*R^{-1}\), 所以 \(A\) 是兩個 Hermite 矩陣 \(R\)\(A^*R^{-1}\) 的乘積,且 \(R\) 是非奇異的.
如果 \(A=HK\), 其中 \(H,K \in M_n\) 是 Hermite 矩陣,且 \(H\) 是非奇異的,那么 \(H^{-1}AH=KH=(HK)^*=A^*\). 如果 \(K\) 是非奇異的,則討論類似. 於是 (d) 等價於 (b).
(d) 肯定蘊含 (e), 現在來證明 (c) 蘊含 (a). 如果 \(A=HK\), 其中 \(H\)\(K\) 是 Hermite 矩陣且兩者都是奇異的,考慮 \(U^*AU=(U^*HU)(U^*KU)\), 其中 \(U \in M_n\) 是酉矩陣,\(U^*HU=\begin{bmatrix} D & 0\\ 0 & 0 \end{bmatrix}\), 且 \(D \in M_k\) 是非奇異的實對角矩陣. 與 \(U^*HU\) 共形地分划 \(U^*KU=\begin{bmatrix} K & \bigstar \\ \bigstar & \bigstar \end{bmatrix}\), 並計算
\begin{align}
U^*AU=(U^*HU)(U^*KU)= \begin{bmatrix} D & 0\\ 0 & 0 \end{bmatrix} \begin{bmatrix} K' & \bigstar \\ \bigstar & \bigstar \end{bmatrix}=\begin{bmatrix} DK' & \bigstar \\ 0 & 0 \end{bmatrix} \notag
\end{align}
分塊 \(DK' \in M_k\) 是兩個 Hermite 矩陣的乘積,其中一個是非奇異的,所以 (d) 、(b) 以及 (a) 的等價性確保它與一個實矩陣相似. 現在先前推論告訴我們 \(U^*AU\)(從而 \(A\) 也) 與一個實矩陣相似.
 
定理 2 中的 (a) 可以通過考慮只取正(或者非負)值的 Hermite 型予以改進.
 
  定理7: 設給定 \(A \in M_n\), 那么對所有的 \(x \in \mathbb{C}^n\), \(x^*Ax\) 是正實數(\(x^*Ax\) 是非負實數)的充分必要條件是:\(A\) 是 Hermite 矩陣且它所有的特征值都是正的(非負的).
 
  證明: 必要性:定理 2 中的 (a) 已經確保 \(A\) 是 Hermite 矩陣,此外,假設 \(\mu \in \mathbb{C}^n\)\(A\) 的與特征值 \(\lambda\) 相伴的特征向量,那么就有 \(\lambda =\mu^*(\lambda \mu)=\mu^* A \mu\), 由假設條件就知 \(\lambda >0\)(或 \(\lambda \geqslant 0\)). 充分性:如果 \(A\) 是 Hermite 矩陣,且只有正的(非負的)特征值,那么定理 4 就確保 \(A=U \Lambda U^*\), 其中酉矩陣 \(U=[u_1\cdots u_n]\) 的列是 \(A\) 的與 \(\Lambda=\mathrm{diag}(\lambda_1,\cdots,\lambda_n)\) 的正的(非負的)對角元素相伴的特征向量. 這樣 \(x^*Ax=x^*U\Lambda U^*x=(U^*x)^*\Lambda (U^*x)=\sum\limits_{k=1}^n \lambda_k \lvert u_k^*x \rvert ^2\) 總是非負的;如果所有 \(\lambda_k>0\) 且有某個 \(\mu_k^* \neq 0\), 那么它是正的,而 \(x \neq 0\) 肯定就是這種情形.
 
  定義2: 矩陣 \(A \in M_n\) 是正定的,如果對於所有非零的 \(x \in \mathbb{C}^n\), \(x^*Ax\) 都是正實數;它是半正定的,如果對於所有非零的 \(x \in \mathbb{C}^n\), \(x^*Ax\) 都是非負實數;它是不定的,如果對於所有非零的 \(x \in \mathbb{C}^n\), \(x^*Ax\) 都是實數,且存在非零向量 \(y,z \in \mathbb{C}^n\), 使得 \(y^*Ay <0 <z^*Az\).
 
\(A \in M_n\) 以及 \(B=A^*A\), 注意到 \(x^*Bx= \lVert Ax \rVert _2^2\), 所以 \(B\) 是半正定的. 這表明:復矩陣是正定的(半定的),當且僅當它是 Hermite 的,且它所有的特征值都是正的(非負的). 所以在定義 2 中,不需要事先假設 \(A\) 是 Hermite 的,但是對於實的矩陣以及它們所生成的實的二次型,情形就有所不同. 如果 \(A \in M_n(\mathbb{R})\)\(x \in \mathbb{C}^n\), 那么 \(x^TAx=\dfrac {1}{2} x^T (A+A^T)\), 所以,對所有的非零的 \(x \in \mathbb{R}^n\)\(X^TAx>0\) 或者 \(x^TAx \geqslant 0\) 這一假設僅僅是在 \(A\) 的對稱部分上附加了一個條件,它的斜對稱部分並未受到限制. 所以定義 2 實的情形的類似結果必須將一個對稱性假設加入進去.

 
  定理8:\(A \in M_n(\mathbb{R})\) 是對稱的. 那么對所有的非零的 \(x \in \mathbb{C}^n\), 有 \(x^*Ax>0\)\(x^*Ax \geqslant 0\)), 當且僅當 \(A\) 的每一個特征值都是正的(非負的).
 
  證明: 由於 \(A\) 是 Hermite 的,故而只要證明下述結論就夠了:只要 \(z=x+\mathrm{i}y \in \mathbb{C}^n\), 其中 \(x,y \in \mathbb{R}^n\), 且 \(x,y\) 中至少一個不為零,就有 \(z^*Az >0 (z^*Az \geqslant 0)\). 由於 \((y^TAx)^T=x^TAy\), 我們有
\begin{align}
z^*Az &=(x+\mathrm{i}y)^*A(x+\mathrm{i}y)=x^TAx+y^TAy+\mathrm{i}(x^TAy-y^TAx) \notag \\
&=x^TAx+y^TAy \notag
\end{align}
它是正的(非負的),如果 \(x\)\(y\) 至少一個不為零.
 
  定義3: 矩陣 \(A \in M_n(\mathbb{R})\) 是正定的,如果對於所有非零的 \(x \in \mathbb{R}^n\), \(x^TAx>0\);它是半正定的,如果對於所有非零的 \(x \in \mathbb{R}^n\), \(x^TAx \geqslant 0\);它是不定的,如果存在向量 \(y,z \in \mathbb{R}^n\), 使得 \(y^TAy <0 <z^TAz\).
 
顯然如果半正定的矩陣是正定的,當且僅當它是非奇異的. 有關 Herimte 矩陣的最后一個一般性的結論是: \(A \in M_n\) 是 Hermite 的,當且僅當它可以寫成 \(A=B-C\), 其中 $B,C \in M_n $ 是半正定的. 這一結論有一半是顯然的,另一半則依賴於下面的定義.
 
  定義4:\(A \in M_n\) 是 Hermite 矩陣,\(\lambda_1 \geqslant \cdots \geqslant \lambda_n\) 是它的按照非增次序排列的特征值. 設 \(\Lambda=\mathrm{diag}(\lambda_1,\cdots,\lambda_n)\), 又令 \(U \in M_n\) 是酉矩陣,它使得 \(A=U \Lambda U^*\). 設 \(\lambda_i^+=\max \{\lambda_i,0\}\) 以及 \(\lambda_i^- =\min \{\lambda_i,0\}\)(兩者都對 \(i=1,\cdots,n\) 定義). 設 \(\Lambda_+=\mathrm{diag}(\lambda_1^+,\cdots,\lambda_n^+)\) 以及 \(A_+=U\Lambda_+U^*\), 令 \(\Lambda_-=\mathrm{diag}(\lambda_1^-,\cdots,\lambda_n^-)\) 以及 \(A_-=-U\Lambda_-U^*\). 矩陣 \(A_+\) 稱為 \(A\)半正定的部分.
 
  命題1:\(A \in M_n\) 是 Hermite 矩陣. 那么 \(A=A_+-A_-\), \(A_+\)\(A_-\) 中的每一個都是半正定的,\(A_+\)\(A_-\) 可交換,\(\mathrm{rank}\,A=\mathrm{rank}\,A_+ + \mathrm{rank}\,A_-\), \(A_+A_-=A_-A_+=0\), 且 \(A_-\)\(-A\) 的半正定部分.

 


應該曉得什么

  • (Toeplitz 分解) 每個 \(A\in M_n\) 都可以用唯一的方式寫成 \(A=H+\mathrm{i}K\)\(A=H+S\)
  • Hermite 矩陣特征值是實的
  • 對所有 \(x \in \mathbb{C}^n\), \(x^*Ax\) 是實的,等價於說 \(A\) 是 Hermite 的
  • \(A\) 是正規的且有實特征值,則 \(A\) 是 Hermite 的


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM