將學習到什么
矩陣 \(A\) 與 \(\dfrac{1}{2}(A+A^T)\) 兩者生成相同的二次型,而后面那個矩陣是對稱的,這樣以來,為了研究實的或者復的二次型,就只需要研究由對稱矩陣生成的二次型.
基本概念
定義1: 矩陣 \(A=[a_{ij}] \in M_n\) 稱為 Hermite 的,如果 \(A=A^*\);它是斜 Hermite 的,如果 \(A=-A^*\).
對於 \(A,B \in M_n\),可得出很多簡單明了的結論:
   (1) \(A+A^*\), \(AA^*\) 以及 \(A^*A\) 都是 Hermite 的
   (2) 如果 \(A\) 是 Hermite 的,那么對所有 \(k=1,2,3,\cdots\), \(A^k\) 都是 Hermite 的. 如果 \(A\) 還是非奇異的,那么 \(A^{-1}\) 是 Hermite 的
   (3) \(A-A^*\) 是斜 Hermite 的
   (4) 如果 \(A\) 是 Hermite 的,那么 \(\mathrm{i}A\) 是斜 Hermite 的;如果 \(A\) 是斜 Hermite 的,那么 \(\mathrm{i}A\) 是 Hermite 的
   (5) \(A=\dfrac{1}{2}(A+A^*)+\dfrac{1}{2}(A-A^*)=H(A)+S(A)=H(A)+\mathrm{i}K(A)\), 其中 \(H(A)=\dfrac{1}{2}(A+A^*)\) 是 \(A\) 的 Hermite 部分,\(S(A)=\dfrac{1}{2}(A-A^*)\) 是 \(A\) 的 斜 Hermite 部分,而 \(K(A)=\dfrac{1}{2\mathrm{i}}(A-A^*)\)
   (6) 如果 \(A=C+\mathrm{i}D\), 其中 \(C,D \in M_n(\mathbb{R})\)(\(A\) 的實部與虛部),那么 \(A\) 是 Hermite 的,當且僅當 \(C\) 是對稱的,且 \(D\) 是斜對稱的
   (7) 實對稱矩陣是復的 Hermite 矩陣
 
   定理1:(Toeplitz 分解) 每個 \(A\in M_n\) 都可以用唯一的方式寫成 \(A=H+\mathrm{i}K\), 其中 \(H\) 與 \(K\) 兩者都是 Hermite 矩陣. 它還可以用唯一的方式寫成 \(A=H+S\),其中 \(H\) 是 Hermite 的,且 \(S\) 是斜 Hermite 的
  
   證明:由上述結論中第 (5) 條即可得出. 至於唯一性,如果令 \(A=E+\mathrm{i}F\), 其中 \(E\) 與 \(F\) 皆為 Hermite 的,那么
 \begin{align}
 2H=A+A^*=(E+\mathrm{i}F)+(E+\mathrm{i}F)^*=E+\mathrm{i}F+E^*-\mathrm{i}F^*=2E
 \end{align}
 所以 \(E=H\). 類似地有 \(F=K\).
  
 前述結論提示我們,誠如每個復數 \(z\) 可以唯一地寫成 \(z=s+\mathrm{i} t\) 一樣(其中 \(s,t \in \mathbb{R}\)), 每一個復矩陣也可以用唯一的方式寫成 \(A=H+\mathrm{i}K\)(其中 \(H\) 與 \(K\) 是 Hermite 矩陣). 還有一些進一步的性質強化了這種類似.
  
   定理2: 設 \(A\in M_n\) 是 Hermite 的. 那么
   (a) \(x^*Ax\) 對所有 \(x \in \mathbb{C}^n\) 都是實的.
   (b) \(A\) 的特征值都是實的
   (c) 對所有 \(S \in M_n\), \(S^*AS\) 都是 Hermite 的
  
   定理3: 設給定 \(A=[a_{ij}]\in M_n\). 那么 \(A\) 是 Hermite 的,當且僅當以下諸條件中至少一條滿足:
   (a) 對所有 \(x \in \mathbb{C}^n\), \(x^*Ax\) 都是實的
   (b) \(A\) 是正規的且有實的特征值
   (c) 對所有 \(S \in M_n\), \(S^*AS\) 都是 Hermite 的
  
   證明:必要性由定理 2 說明,只需證明充分性。
 (a) 如果對所有 \(x \in \mathbb{C}^n\), \(x^*Ax\) 都是實的,那么對所有 $x,y\in \mathbb{C}^n $, \((x+y)^*A(x+y)=(x^*Ax+y^*Ay)+(x^*Ay+y^*Ax)\) 是實的. 由於根據假設 \(x^*Ax\) 與 \(y^*Ay\) 是實的,我們就斷定:對所有 $x,y\in \mathbb{C}^n $, \(x^*Ay+y^*Ax\) 是實的. 如果我們選取 \(x=e_k\) 以及 \(y=e_j\), 那么 \(x^*Ay+y^*Ax=a_{kj}+a_{jk}\) 是實的,所以 \(\mathrm{Im} \,a_{kj}=-\mathrm{Im} \,a_{jk}\). 如果我們選取 \(x=\mathrm{i} e_k\) 以及 \(y=e_j\), 那么 \(x^*Ay+y^*Ax=-\mathrm{i}a_{kj}+\mathrm{i}a_{jk}\) 是實的,所以 \(\mathrm{Re} \,a_{kj}=\mathrm{Re} \,a_{jk}\). 所以 \(a_{kj}=\bar{a}_{jk}\), 又因為 \(j,k\) 是任意的,我們就得出結論 \(A=A^*\).
 (b) 如果 \(A\) 是正規的,那么可以酉對角化,所以 \(A=U\Lambda U^*\), 其中 \(\Lambda=\mathrm{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)\). 一般來說,我們有 \(A^*=U\bar{\Lambda} U^*\), 但如果 \(\Lambda\) 是實的,我們就有 \(A^*=U\Lambda U^*=A\).
 (c) 條件 (c) 蘊含 \(A\) 是 Hermite 的(選取 \(S=I\))
  
 由於 Hermite 矩陣都是正規的,所以有關正規矩陣的所有結果都適用於 Hermite 矩陣. 例如,與不同特征值相伴的特征向量是正交的,存在一組由特征向量組成的標准正交基以及 Hermite 矩陣可以酉對角化.下面復述關於 Hermite 矩陣的譜定理.
  
   定理4: 矩陣 \(A \in M_n\) 是 Hermite 的,當且僅當存在一個酉矩陣 \(U \in M_n\) 以及一個實的對角矩陣 \(\Lambda \in M_n\), 使得 \(A=U\Lambda U^*\). 此外, \(A\) 是實的 Hermite 矩陣(即實對稱矩陣),當且僅當存在一個實正交矩陣 \(P \in M_n\) 以及一個實對角矩陣 \(\Lambda \in M_n\), 使得 \(A=P\Lambda P^T\).
  
 盡管 Hermite 矩陣的實線性組合恆為 Hermite 矩陣,但是 Hermite 矩陣的復線性組合不一定是 Hermite 矩陣. 此外,如果 \(A\) 與 \(B\) 是 Hermite 矩陣,那么 \((AB)^*=B^*A^*=BA\), 所以 \(AB\) 是 Hermite 矩陣,當且僅當 \(A\) 與 \(B\) 可交換.
 關於可交換的 Hermite 矩陣的一個最有名的結果如下:
  
   定理5: 設 \(\mathcal{F}\) 是一個給定的非空的 Hermite 矩陣族. 則存在一個酉矩陣 \(U\) 使得對所有 \(A \in \mathcal{F}\), \(UAU^*\) 都是對角矩陣的充分必要條件是,對所有 \(A,B \in \mathcal{F}\) 都有 \(AB=BA\).
  
推廣
對於 Hermite 矩陣 \(A\) 有 \(A=A^*\), 推廣這一概念的一種方法是考慮使得 \(A\) 相似於 \(A^*\) 的矩陣類. 如下的定理拓廣了推論1,並用若干種方式刻畫了這個矩陣類的特征.
  
   定理6: 設給定 \(A \in M_n\), 則如下諸命題等價:
   (a) \(A\) 與一個實矩陣相似
   (b) \(A\) 與 \(A^*\) 相似
   (c) \(A\) 通過一個 Hermite 相似變換與 \(A^*\) 相似
   (d) \(A=HK\), 其中 \(H,K \in M_n\) 是 Hermite 矩陣,且至少有一個因子是非奇異的
   (e) \(A=HK\), 其中 \(H,K \in M_n\) 是 Hermite 矩陣
  
   證明:首先注意 (a) 與 (b) 是等價的:每一個復矩陣都與它的轉置相似,所以,\(A\) 相似於 \(A^*=\bar{A}^T\) 當且僅當 \(A\) 相似於 \(\bar{A}\), 當且僅當 \(A\) 相似於一個實矩陣.
 為驗證 (b) 蘊含 (c),假設存在一個非奇異的 \(S \in M_n\), 使得 \(S^{-1}AS=A^*\). 設 \(\theta \in \mathbb{R}\), 並令 \(T=\mathrm{e}^{\mathrm{i}\theta} S\). 注意到 \(T^{-1}AT=A^*\), 這樣一來,就有 \(AT=TA^*\) 或者 \(AT^*=T^*A^*\). 將這兩個等式相加就得到 \(A(T+T^*)=(T+T^*)A^*\). 如果 \(T+T^*\) 是非奇異的,我們就能斷言 \(A\) 與 \(A^*\) 通過 Hermite 矩陣 \(T+T^*\) 而相似,所以就只需要證明存在某個 \(\theta\), 使得 \(T+T^*\) 是非奇異的. 矩陣 \(T+T^*\) 是非奇異的,漢且僅當 \(T^{-1}(T+T^*)=I+T^{-1}T^*\) 是非奇異的,當且僅當 \(-1 \notin \sigma(T^{-1}T^*)\). 但是 \(T^{-1}T^*=\mathrm{e}^{-2\mathrm{i}\theta} S^{-1}S^*\), 所以我們可以選取滿足 \(-\mathrm{e}^{-2\mathrm{i}\theta} \notin \sigma(S^{-1}S^*)\) 的任何 \(\theta\).
 現在假設 (c) 成立,並記 \(R^{-1}AR=A^*\), 其中 \(R \in M_n\) 是非奇異的 Hermite 矩陣. 那么 \(R^{-1}A=A^*R^{-1}\) 且 \(A=R(A^*R^{-1})\). 但是 \((A^*R^{-1})^*=R^{-1}A=A^*R^{-1}\), 所以 \(A\) 是兩個 Hermite 矩陣 \(R\) 與 \(A^*R^{-1}\) 的乘積,且 \(R\) 是非奇異的.
 如果 \(A=HK\), 其中 \(H,K \in M_n\) 是 Hermite 矩陣,且 \(H\) 是非奇異的,那么 \(H^{-1}AH=KH=(HK)^*=A^*\). 如果 \(K\) 是非奇異的,則討論類似. 於是 (d) 等價於 (b).
 (d) 肯定蘊含 (e), 現在來證明 (c) 蘊含 (a). 如果 \(A=HK\), 其中 \(H\) 與 \(K\) 是 Hermite 矩陣且兩者都是奇異的,考慮 \(U^*AU=(U^*HU)(U^*KU)\), 其中 \(U \in M_n\) 是酉矩陣,\(U^*HU=\begin{bmatrix} D & 0\\ 0 & 0 \end{bmatrix}\), 且 \(D \in M_k\) 是非奇異的實對角矩陣. 與 \(U^*HU\) 共形地分划 \(U^*KU=\begin{bmatrix} K & \bigstar \\ \bigstar & \bigstar \end{bmatrix}\), 並計算
 \begin{align}
 U^*AU=(U^*HU)(U^*KU)= \begin{bmatrix} D & 0\\ 0 & 0 \end{bmatrix} \begin{bmatrix} K' & \bigstar \\ \bigstar & \bigstar \end{bmatrix}=\begin{bmatrix} DK' & \bigstar \\ 0 & 0 \end{bmatrix} \notag
 \end{align}
 分塊 \(DK' \in M_k\) 是兩個 Hermite 矩陣的乘積,其中一個是非奇異的,所以 (d) 、(b) 以及 (a) 的等價性確保它與一個實矩陣相似. 現在先前推論告訴我們 \(U^*AU\)(從而 \(A\) 也) 與一個實矩陣相似.
  
 定理 2 中的 (a) 可以通過考慮只取正(或者非負)值的 Hermite 型予以改進.
  
   定理7: 設給定 \(A \in M_n\), 那么對所有的 \(x \in \mathbb{C}^n\), \(x^*Ax\) 是正實數(\(x^*Ax\) 是非負實數)的充分必要條件是:\(A\) 是 Hermite 矩陣且它所有的特征值都是正的(非負的).
  
   證明: 必要性:定理 2 中的 (a) 已經確保 \(A\) 是 Hermite 矩陣,此外,假設 \(\mu \in \mathbb{C}^n\) 是 \(A\) 的與特征值 \(\lambda\) 相伴的特征向量,那么就有 \(\lambda =\mu^*(\lambda \mu)=\mu^* A \mu\), 由假設條件就知 \(\lambda >0\)(或 \(\lambda \geqslant 0\)). 充分性:如果 \(A\) 是 Hermite 矩陣,且只有正的(非負的)特征值,那么定理 4 就確保 \(A=U \Lambda U^*\), 其中酉矩陣 \(U=[u_1\cdots u_n]\) 的列是 \(A\) 的與 \(\Lambda=\mathrm{diag}(\lambda_1,\cdots,\lambda_n)\) 的正的(非負的)對角元素相伴的特征向量. 這樣 \(x^*Ax=x^*U\Lambda U^*x=(U^*x)^*\Lambda (U^*x)=\sum\limits_{k=1}^n \lambda_k \lvert u_k^*x \rvert ^2\) 總是非負的;如果所有 \(\lambda_k>0\) 且有某個 \(\mu_k^* \neq 0\), 那么它是正的,而 \(x \neq 0\) 肯定就是這種情形.
  
   定義2: 矩陣 \(A \in M_n\) 是正定的,如果對於所有非零的 \(x \in \mathbb{C}^n\), \(x^*Ax\) 都是正實數;它是半正定的,如果對於所有非零的 \(x \in \mathbb{C}^n\), \(x^*Ax\) 都是非負實數;它是不定的,如果對於所有非零的 \(x \in \mathbb{C}^n\), \(x^*Ax\) 都是實數,且存在非零向量 \(y,z \in \mathbb{C}^n\), 使得 \(y^*Ay <0 <z^*Az\).
  
 設 \(A \in M_n\) 以及 \(B=A^*A\), 注意到 \(x^*Bx= \lVert Ax \rVert _2^2\), 所以 \(B\) 是半正定的. 這表明:復矩陣是正定的(半定的),當且僅當它是 Hermite 的,且它所有的特征值都是正的(非負的). 所以在定義 2 中,不需要事先假設 \(A\) 是 Hermite 的,但是對於實的矩陣以及它們所生成的實的二次型,情形就有所不同. 如果 \(A \in M_n(\mathbb{R})\) 且 \(x \in \mathbb{C}^n\), 那么 \(x^TAx=\dfrac {1}{2} x^T (A+A^T)\), 所以,對所有的非零的 \(x \in \mathbb{R}^n\) 有 \(X^TAx>0\) 或者 \(x^TAx \geqslant 0\) 這一假設僅僅是在 \(A\) 的對稱部分上附加了一個條件,它的斜對稱部分並未受到限制. 所以定義 2 實的情形的類似結果必須將一個對稱性假設加入進去.
 
   定理8: 設 \(A \in M_n(\mathbb{R})\) 是對稱的. 那么對所有的非零的 \(x \in \mathbb{C}^n\), 有 \(x^*Ax>0\)(\(x^*Ax \geqslant 0\)), 當且僅當 \(A\) 的每一個特征值都是正的(非負的).
  
   證明: 由於 \(A\) 是 Hermite 的,故而只要證明下述結論就夠了:只要 \(z=x+\mathrm{i}y \in \mathbb{C}^n\), 其中 \(x,y \in \mathbb{R}^n\), 且 \(x,y\) 中至少一個不為零,就有 \(z^*Az >0 (z^*Az \geqslant 0)\). 由於 \((y^TAx)^T=x^TAy\), 我們有
 \begin{align}
 z^*Az &=(x+\mathrm{i}y)^*A(x+\mathrm{i}y)=x^TAx+y^TAy+\mathrm{i}(x^TAy-y^TAx) \notag \\
 &=x^TAx+y^TAy \notag
 \end{align}
 它是正的(非負的),如果 \(x\) 與 \(y\) 至少一個不為零.
  
   定義3: 矩陣 \(A \in M_n(\mathbb{R})\) 是正定的,如果對於所有非零的 \(x \in \mathbb{R}^n\), \(x^TAx>0\);它是半正定的,如果對於所有非零的 \(x \in \mathbb{R}^n\), \(x^TAx \geqslant 0\);它是不定的,如果存在向量 \(y,z \in \mathbb{R}^n\), 使得 \(y^TAy <0 <z^TAz\).
  
 顯然如果半正定的矩陣是正定的,當且僅當它是非奇異的. 有關 Herimte 矩陣的最后一個一般性的結論是: \(A \in M_n\) 是 Hermite 的,當且僅當它可以寫成 \(A=B-C\), 其中 $B,C \in M_n $ 是半正定的. 這一結論有一半是顯然的,另一半則依賴於下面的定義.
  
   定義4: 設 \(A \in M_n\) 是 Hermite 矩陣,\(\lambda_1 \geqslant \cdots \geqslant \lambda_n\) 是它的按照非增次序排列的特征值. 設 \(\Lambda=\mathrm{diag}(\lambda_1,\cdots,\lambda_n)\), 又令 \(U \in M_n\) 是酉矩陣,它使得 \(A=U \Lambda U^*\). 設 \(\lambda_i^+=\max \{\lambda_i,0\}\) 以及 \(\lambda_i^- =\min \{\lambda_i,0\}\)(兩者都對 \(i=1,\cdots,n\) 定義). 設 \(\Lambda_+=\mathrm{diag}(\lambda_1^+,\cdots,\lambda_n^+)\) 以及 \(A_+=U\Lambda_+U^*\), 令 \(\Lambda_-=\mathrm{diag}(\lambda_1^-,\cdots,\lambda_n^-)\) 以及 \(A_-=-U\Lambda_-U^*\). 矩陣 \(A_+\) 稱為 \(A\) 的半正定的部分.
  
   命題1:設 \(A \in M_n\) 是 Hermite 矩陣. 那么 \(A=A_+-A_-\), \(A_+\) 與 \(A_-\) 中的每一個都是半正定的,\(A_+\) 與 \(A_-\) 可交換,\(\mathrm{rank}\,A=\mathrm{rank}\,A_+ + \mathrm{rank}\,A_-\), \(A_+A_-=A_-A_+=0\), 且 \(A_-\) 是 \(-A\) 的半正定部分.
應該曉得什么
- (Toeplitz 分解) 每個 \(A\in M_n\) 都可以用唯一的方式寫成 \(A=H+\mathrm{i}K\) 或 \(A=H+S\)
 - Hermite 矩陣特征值是實的
 - 對所有 \(x \in \mathbb{C}^n\), \(x^*Ax\) 是實的,等價於說 \(A\) 是 Hermite 的
 - \(A\) 是正規的且有實特征值,則 \(A\) 是 Hermite 的
 
