將學習以什么
關於正規矩陣的基礎知識
理解正規矩陣
定義
定義 1: 矩陣 \(A\in M_n\) 稱為是正規的,如果 \(AA^*=A^*A\), 也就是,如果 \(A\) 與它的共軛轉置可交換。
根據定義可以得出以下結論:
- 如果 \(A\in M_n\) 是正規的,且 \(\alpha \in \mathbb{C}\), 顯然 \(\alpha A\) 是正規的. 即正規矩陣類在用復純量作的乘法運算下是封閉的
- 如果 \(A\in M_n\) 是正規的,又如果 \(B\) 與 \(A\) 酉相似,即存在酉矩陣 \(U\) 使得 \(B=U^*AU\), 由 \(BB^*=(U^*AU)(U^*A^*U)=U^*AA^*U=U^*A^*UU^*AU=B^*B\), 所以 \(B\) 也是正規的,即正規矩陣類在酉相似之下是封閉的
- 如果 \(A\in M_n\) 與 \(B \in M_m\) 是正規的, 顯然 \(A\oplus B\in M_{n+m}\) 是正規的. 即正規矩陣類在直和運算下是封閉的
- 如果 \(A\in M_n\) 與 \(B \in M_m\), 如果 \(A\oplus B\in M_{n+m}\) 是正規的,那么 \(A\) 與 \(B\) 也是正規的
- 每個酉矩陣、Hermite 矩陣、斜 Hermite 矩陣、實正交矩陣、實對稱矩陣以及實的斜對稱矩陣都是正規的
幾何角度
對於正規矩陣 \(A\in M_n\), 按列來分划 \(A=[c_1 \quad \cdots \quad c_n]\) 以及 \(A^T=[r_1 \quad \cdots \quad r_n]\), 向量 \(c_j\) 是 \(A\) 的列,而向量 \(r_i^T\) 是 \(A\) 的行. 定義恆等式 \(AA^*=A^*A\) 提示出:\(A\) 是正規的,當且僅當對所有 \(i,j=1,\cdots,n\) 都有 \(c_i^*c_j=\overline{r_i^*r_j}\), 特別地,\(c_i^*c_i=\lVert c_i \rVert _2^2 = \lVert r_i \rVert _2^2=r_i^*r_i\), 所以 \(A\) 的每一列與它對應的行一樣,有同樣的 Euclid 范數;一列為零當且僅當對應的行為零.
如果 \(A \in M_n(\mathbb{R})\) 是實的正規矩陣,那么對所有 \(i\) 與 \(j\) 都有 \(c_i^Tc_j=\langle c_i,c_j \rangle=\langle r_i, r_j \rangle=r_i^T r_j\). 如果 \(i\) 列與 \(j\) 列不是零,那么 \(i\) 行與 \(j\) 行不是零,且恆等式
\begin{align}
\frac{\langle c_i,c_j \rangle}{\lVert c_i \rVert _2 \lVert c_j \rVert _2} =\frac{\langle r_i, r_j \rangle}{\lVert r_i \rVert _2 \lVert r_j \rVert _2}
\end{align}
告訴我們:\(A\) 的 \(i\) 列與 \(j\) 列的向量之間的角度與 \(A\) 的 \(i\) 行與 \(j\) 行的向量之間的角度是相同的.
對於正規矩陣。關於它的某種為零的分塊有某些特殊之處.
引理 1: 設 \(A\in M_n\) 被分划成 \(A=\begin{bmatrix} A_{11} & A_{12} \\ 0 & A_{22} \end{bmatrix}\), 其中 \(A_{11}\) 與 \(A_{22}\) 是方陣. 那么 \(A\) 是正規的,當且僅當 \(A_{11}\) 與 \(A_{22}\) 是正規的,且 \(A_{12}=0\). 分塊上三角矩陣是正規的,當且僅當它位於對角線之外的分塊是零且每一個對角線上的分塊都是正規的. 特別地,上三角矩陣是正規的,當且僅當它是對角的.
證明: 如果 \(A_{11}\) 與 \(A_{22}\) 是正規的,且 \(A_{12}=0\), 那么 \(A=A_{11}\oplus A_{22}\) 就是正規矩陣的直和,故而它是正規的. 反之,如果 \(A\) 是正規的,那么
\begin{align}
AA^*=\begin{bmatrix} A_{11}A_{11}^*+A_{12}A_{12}^* & \bigstar \\ \bigstar & \bigstar \end{bmatrix}=\begin{bmatrix} A_{11}^*A_{11} & \bigstar \\ \bigstar & \bigstar \end{bmatrix}=A^*A
\end{align}
那么 \(A_{11}^*A_{11}=A_{11}A_{11}^*+A_{12}A_{12}^*\), 它蘊含
\begin{align}
\mathrm{tr}\,A_{11}^*A_{11} & =\mathrm{tr}\,(A_{11}A_{11}^*+A_{12}A_{12}^*) \notag \\
&=\mathrm{tr}\,A_{11}A_{11}^* + \mathrm{tr}\,A_{12}A_{12}^* =\mathrm{tr}\,A_{11}^*A_{11} + \mathrm{tr}\,A_{12}A_{12}^*
\end{align}
從而 \(\mathrm{tr}\,A_{12}A_{12}^*=0\). 由於 \(\mathrm{tr}\,A_{12}A_{12}^*\) 是 \(A_{12}\) 的元素的絕對值的平方和,由此推出 \(A_{12}=0\). 這樣 \(A=A_{11}\oplus A_{22}\) 就是正規的,所以 \(A_{11}\) 與 \(A_{22}\) 都是正規的. 后面的部分用歸納法即可說明.
基本結果
下面對有關正規矩陣的基本結果進行整理分類。
定理 1: 設 \(A=[a_{ij}]\in M_n\) 有特征值 \(\lambda_1,\cdots,\lambda_n\), 則下述諸命題等價.
(a) \(A\) 是正規的
(b) \(A\) 可以酉對角化
(c) \(\sum\limits_{i,j=1}^n \lvert a_{ij} \rvert ^2= \sum\limits_{i=1}^n \lvert \lambda_i \rvert ^2\)
(d) \(A\) 有 \(n\) 個標准正交的特征向量
證明: 由Schur 定理知,\(A\) 可以寫成 \(A=UTU^*\), 其中 \(U=[u_1 \quad \cdots \quad u_n]\) 是酉矩陣,而 \(T=[t_{ij}]\in M_n\) 是上三角矩陣. 如果 \(A\) 是正規的,則 \(T\) 亦然(與每一個與 \(A\) 酉相似的矩陣一樣). 引理 1 確保了 \(T\) 實際上是對角矩陣,故而 \(T\) 可以酉對角化.
如果存在一個酉矩陣 \(V\), 使得 \(A=V\Lambda V^*\), 且 \(\Lambda=\mathrm{diag}(\lambda_1,\cdots,\lambda_n)\), 那么有 \(\mathrm{tr}\,A^*A=\mathrm{tr}\,\Lambda^*\Lambda\), 這就是 (c) 中的結論.
\(T\) 的對角元素是 \(\lambda_1,\cdots,\lambda_n\), 從而 \(\mathrm{tr}\,A^*A=\mathrm{tr}\,T^*T=\sum\limits_{i=1}^n \lvert \lambda_i \rvert ^2+\sum\limits_{i<j}^n \lvert t_{ij} \rvert ^2\). 於是 (c) 蘊含 \(\sum\limits_{i<j}^n \lvert t_{ij} \rvert ^2=0\), 所以 \(T\) 是對角的. 分解式 \(A=UTU^*\) 等價於等式 \(AU=UT\), 等式是說,對每一個 \(i=1,\cdots,n\) 都有 \(Au_i=t_{ii}u_i\). 從而 \(U\) 的 \(n\) 列是 \(A\) 的標准正交的特征向量.
最后,標准正交組是線性無關的,所以 (d) 確保 \(A\) 可以對角化,且可以選擇標准正交化的列作為對角化相似矩陣. 這就意味着 \(A\) 與一個對角矩陣(從而是酉矩陣,也是正規矩陣)酉相似,所以 \(A\) 是正規的.
正規矩陣 \(A\in M_n\) 表示成 \(A=U\Lambda U^*\)(其中 \(U\) 是酉矩陣,而 \(\Lambda\) 是對角矩陣)的表示法稱為 \(A\) 的譜分解. 由特征多項式、代數重數與幾何重數定義 2.3 知,一個矩陣可對角化,當且僅當它是無虧的, 所以說正規矩陣是無虧的.
一般結果
如果 \(X,Y \in M_{n,k}\) 都有標准正交的列,又如果 \(\mathrm{range}\,X=\mathrm{range}\,Y\), 那么 \(X\) 的每一列都是 \(Y\) 的線性組合,這就是說,對某個 \(G \in M_k\) 有 \(X=YG\). 這樣就有 \(I_k=X^*X=(YG)^*(YG)=G^*(Y^*Y)G=G^*G\), 所以 \(G\) 必定是酉矩陣. 這一結果就對如下的唯一性定理的第一部分給出一人幾何解釋.
定理 2: 設 \(A \in M_n\) 是正規的,且有不同的特征值 \(\lambda_1, \cdots, \lambda_d\), 其重數分別為 \(n_1, \cdots,n_d\). 設 \(\Lambda= \lambda_1 I_{n_1} \oplus \cdots \oplus \lambda_d I_{n_d}\), 並假設 \(U \in M_n\) 是酉矩陣以及 \(A=U \lambda U^*\).
(a) 對某個酉矩陣 \(V \in M_n\) 有 \(A=V \Lambda V^*\), 當且僅當存在酉矩陣 \(W_1, \cdots, W_d\), 每個 \(W_i \in M_{n_i}\), 使得 \(U=V(W_1 \oplus \cdots \oplus W_d)\).
(b) 兩個正規矩陣是酉相似的,當且僅當它們有同樣的特征值.
證明: (a) 如果 \(U \Lambda U^* = V \Lambda V^*\), 那么 \(\Lambda U^* V=U^*V \Lambda\), 所以 \(W=U^*V\) 是酉矩陣,且與 \(\Lambda\) 可交換,先前結果確保 \(W\) 是與 \(\Lambda\) 共形的分塊對角矩陣. 反之,如果 \(U=VW\) 以及 \(W=W_1 \oplus \cdots \oplus W_d\), 其中每一個 \(W_i \in M_{n_i}\), 這樣 \(W\) 就與 \(\Lambda\) 可交換,且 \(U \Lambda U^* = VW \Lambda W^*V^*=V \Lambda WW^* V^*=V \Lambda V^*\).
(b) 如果對某個酉矩陣 \(V\) 有 \(B=V\Lambda V^*\), 那么 \((UV^*)B(UV^*)^*=(UV^*)V\Lambda V^*(UV^*)^*=U\Lambda U^*=A\). 反之,如果 \(B\) 與 \(A\) 相似,那么它們有相同的特征值;如果 \(B\) 與一個正規矩陣相似,那么它也是正規的.
兩個矩陣有同樣的特征值不一定是相似的,定理 2 中(b) 說明了如果它們是正規矩陣,那就肯定是相似的. 接下來注意可交換的正規矩陣可以同時酉對角化.
定理 3: 設 \(\mathcal{N} \in M_n\) 是一個非空的正規矩陣族. 那么 \(\mathcal{N}\) 是一個交換族,當且僅當它是可以同時酉對角化的族. 對任一給定的 \(A_0 \in \mathcal{N}\) 以及對 \(A_0\) 的特征值的任意一個給定的排序 \(\lambda_1, \cdots, \lambda_n\), 都存在一個酉矩陣 \(U \in M_n\), 使得 \(U^*A_0 U= \mathrm{diag} (\lambda_1, \cdots, \lambda_n)\), 且對每個 \(B \in \mathcal{N}\), \(U^*BU\) 都是對角矩陣.
證明:由酉三角化中定理 1.2 知:由復矩陣組成的一個交換族可以通過單獨一個酉相似同時化簡為上三角型,又已知正規的三角矩陣必定是對角矩陣這一事實即可證明.關於 \(A_0\) 的結論,了解即可.
定理 1 應用於 Hermite 矩陣這種特征情形就會得到一個基本的結果,它稱之為關於Hermite 矩陣的譜定理.
定理 4: 設 \(A \in M_n\) 是 Hermite 矩陣且有特征值 \(\lambda_1, \cdots, \lambda_n\), 設 \(\Lambda = \mathrm{diag} (\lambda_1, \cdots, \lambda_n)\).
(a) \(\lambda_1, \cdots, \lambda_n\) 是實數
(b) \(A\) 可以酉對角化
(c) 存在一個酉矩陣 \(U \in M_n\), 使得 \(A=U \Lambda U^*\)
證明: Hermite 對角矩陣的對角元素必定是實數,所以 (a) 就從 (b) 以及如下事實推出: Hermite 矩陣的集合在酉相似之下是封閉的. Hermite 矩陣是正規的,所以可酉對角化. 命題 (c) 是 (b) 的復述並加入了如下信息: \(\Lambda\) 的對角元素必定是 \(A\) 的特征值.
關於實的正規矩陣
實的正規矩陣可能通過復的酉相似對角化. 但是通過實正交相似可以得到何種特殊形式呢?由於實正規矩陣可能有非實的特征值,有可能無法用實相似使之對角化. 然而,每一個實矩陣都與一個實的似三角實正交相似,這個擬三角矩陣必定還是擬對角的,如果它是正規的.
引理 2: 假設 $A=\begin{bmatrix} a & b \\ c &d \end{bmatrix} \in M_2(\mathbb{R}) $ 是正規的,且有一對共軛的非實特征值. 那么 \(c=-b \neq 0\) 且 \(d=a\).
證明: 計算表明:\(AA^T=A^TA\) 當且僅當 \(b^2=c^2\) 且 \(ac+bd=ab+cd\). 如果 \(b=c\), 則 \(A\) 是 Hermite 的,所以上面的定理保證它有兩個實的特征值. 這樣一來,我們必有 \(b=-c \neq 0\) 以及 \(b(d-a)=b(a-d)\), 這就蘊含 \(a=d\).
定理 4: 設 \(A \in M_n(\mathbb{R})\) 是正規的.
(a) 存在一個實正交矩陣 \(Q \in M_n(\mathbb{R})\), 使得 \(Q^TAQ\) 是實的擬對角矩陣
\begin{align} \label{e5}
A_1 \oplus \cdots \oplus A_m \in M_n(\mathbb{R}), \quad \text{每個},, A_i ,, \text{都是},, 1 \times 1 ,, \text{或},, 2\times 2 ,, \text{的}
\end{align}
它滿足下述性質:上式中的那些 \(1\times 1\) 直和項給出 \(A\) 所有實的特征值. \(2 \times 2\) 直和項有特殊的形式
\begin{align} \label{e6}
\begin{bmatrix} a & b \\ -b & a \end{bmatrix}
\end{align}
其中 \(b>0\). 該矩陣是正規的且有特征值 \(a \pm \mathrm{i} b\).
(b) 式 \ref{e5} 中的直和項由 \(A\) 的特征值完全決定,它們可以按照任意預先指定的次序出現.
(c) 兩個實的 \(n \times n\) 正規矩陣是實正交相似的,當且僅當它們有同樣的特征值.
證明:實 Schur 型 確保 \(A\) 與一個實的上擬三角矩陣實正交相似,它的每一個 \(2 \times 2\) 對角分塊有一對非實的共軛特征值. 由於這個擬三角矩陣是正規的,所以它實際上是擬對角的,且它的每一個 \(2 \times 2\) 直和項都是正規的,且有一對共軛的非實特征值. 上一個引理告訴我們:這些 \(2 \times 2\) 直和項中的每一個都有特殊的形式 \ref{e6}, 其中 \(b \neq 0\). 如果必要,我們可以通過矩陣 \(\begin{bmatrix} 1 & 0 \\ 0 & -1 \end{bmatrix}\) 做成的相似來確保 \(b>0\). (b) \ref{e5} 中的直和項給出了 \(A\) 所有的特征值,且通過置換相似還能使得這些直和項按照所期望的任何次序排列. (c) 兩個有同樣的特征值的實的 \(n \times n\) 正規矩陣與同一個形如 \ref{e5} 的直和實正交相似.
上一個定理揭示出實正規矩陣在實正交相似下的標准型. 它引導到實對稱矩陣、實的斜對稱矩陣以及實正交矩陣在實正交相似之下的標准型.
應該知道什么
- 每個酉矩陣、Hermite 矩陣、斜 Hermite 矩陣、實正交矩陣、實對稱矩陣以及實的斜對稱矩陣都是正規的
- 正規矩陣類在酉相似和直和之下是封閉的
- 正規矩陣可以酉對角化且是無虧的
- 兩個正規矩陣是酉相似的,當且僅當它們有同樣的特征值
- 可交換的正規矩陣可以同時酉對角化