將學習到什么
本節討論關於實矩陣的實形式的 Jordan 標准型,也討論關於復矩陣的另外一種形式的 Jordan 標准型,因為它在與交換性有關的問題中很有用.
實 Jordan 標准型
假設 \(A \in M_n(\mathbb{R})\), 所以任何非實的特征值必定成對共軛出現,由於結任何 \(\lambda \in \mathbb{C}\), 以及所有 \(k=1,2,\cdots\) 我們有 \(\mathrm{rank} \, (A-\lambda I)^k= \mathrm{rank} \, \overline{(A-\lambda I)^k}=\mathrm{rank} \, \overline{(A-\lambda I)}^k=\mathrm{rank} \, (A-\bar{\lambda} I)^k\), 所以我們斷定 \(A\) 的各種階的有非實特征值的 Jordan 分塊中,同階的分塊總是共軛成對出現. 比如,如果在 \(A\) 的 Jordan 標准型中有 \(k\) 個分塊 \(J_2(\lambda)\), 那么有 \(k\) 個分塊 \(J_2(\bar{\lambda})\), 分塊對角矩陣
\begin{align}
\begin{bmatrix} J_2(\lambda) & \\ 0 & J_2(\bar{\lambda}) \end{bmatrix} = \left [ \begin{array}{cc|cc} \lambda & 1 & \\ 0 & \lambda & & \\ \hline & & \bar{\lambda} & 1 \\ && 0& \bar{\lambda} \end{array} \right ]
\end{align}
通過交換 2,3 行以及 2,3 列,其置換相似於分塊上三角矩陣
\begin{align}
\left [ \begin{array}{cc|cc} \lambda & 0 & 1 & 0 \\ 0 & \bar{\lambda} & 0 & 1 \\ \hline & & \lambda & 0 \\ && 0& \bar{\lambda} \end{array} \right ] =\begin{bmatrix} D(\lambda) & I_2 \\ & D(\lambda) \end{bmatrix}
\end{align}
其中 $ D(\lambda)=\begin{bmatrix} \lambda & 0 \\ 0 & \bar{\lambda} \end{bmatrix} \in M_2$.
一般來說,形如
\begin{align} \label{e1}
\begin{bmatrix} J_k(\lambda) & \\ 0 & J_k(\bar{\lambda}) \end{bmatrix} \in M_{2k}
\end{align}
的 Jordan 矩陣置換相似於分塊上三角(分塊雙對角)矩陣
\begin{align} \label{e4}
\begin{bmatrix} D(\lambda) & I_2 & & & \\ & D(\lambda) & I_2 & & \\ & & \ddots & \ddots & \\ &&& \ddots & I_2 \\ &&&& D(\lambda) \end{bmatrix} \in M_{2k}
\end{align}
實現地時候可按照上述舉例方法一步步上移,注意避免下對角出現非零元素. 它在分塊主對角線上有 \(k\) 個 \(2 \times 2\) 的塊 \(D(\lambda)\), 且分塊超對角線上有 \(k-1\) 個分塊 \(I_2\).
設 \(\lambda=a+\mathrm{i}b, a,b \in \mathbb{R}\). 計算表明 \(D(\lambda)\) 相似於實矩陣
\begin{align} \label{e111}
C(a,b):=\begin{bmatrix} a & b \\ -b & a \end{bmatrix} =SD(\lambda)S^{-1}
\end{align}
其中 \(S=\begin{bmatrix} -\mathrm{i} & -\mathrm{i} \\ 1 & -1 \end{bmatrix}\), 而 \(S^{-1}=\dfrac{1}{2\mathrm{i}}\begin{bmatrix} -1 & \mathrm{i} \\ -1 & -\mathrm{i} \end{bmatrix}\). 此外,對非實的 \(\lambda\), 每一個形如 \ref{e4} 的分塊矩陣都通過相似矩陣 \(S\oplus \cdots \oplus S\)(\(k\) 個直和項)與形如
\begin{align} \label{e3}
C_k(a,b):=\begin{bmatrix} C(a,b) & I_2 & & & \\ & C(a,b) & I_2 & & \\ & & \ddots & \ddots & \\ &&& \ddots & I_2 \\ &&&& C(a,b) \end{bmatrix} \in M_{2k}
\end{align}
的實分塊矩陣相似. 從而每一個形如 \ref{e1} 的分塊對角矩陣都相似於 \ref{e3} 中的矩陣 \(C_k(a,b)\). 這些結論將我們引導到實 Jordan 標准型定理.
定理1: 每一個 \(A \in M_n{\mathbb{R}}\) 都通過一個實相似與一個形如
\begin{align} \label{e5}
C_{n_1}(a_1,b_1) \oplus \cdots \oplus C_{n_p}(a_p,b_p) \oplus J_{m_1}(\mu_1) \oplus \cdots \oplus J_{m_r}(\mu_r)
\end{align}
的實分塊對角矩陣相似,其中 $\lambda_k=a_k+\mathrm{i}b_k(k=1,2,\cdots p) $ 是 \(A\) 的非實特征值,每一個 \(a_k\) 以及 \(b_k\) 都是實的,且 \(b_k >0\), 而 \(\mu_1,\cdots,\mu_r\) 是 \(A\) 的實特征值. 每一個實的分塊三角矩陣 \(C_{n_k}(a_k,b_k) \in M_{2n_k}\) 都有 \ref{e3} 的形式,且與 \(A\) 的 Jordan 標准型中與非零的實特征值 \(\lambda_k\) 相關的一對共軛 Jordan 塊 \(J_{n_k}(\lambda_k),J_{n_k}(\overline{\lambda_k}) \in M_{n_k}\) 相對應. \ref{e5} 中的實的 Jordan 塊 \(J_{m_k}(\mu_k)\) 就是Jordan 標准型中有實特征值的那些 Jordan 塊.
分塊矩陣 \ref{e5} 就是 \(A\) 的實 Jordan 標准型. 下面的推論總結了另外幾個與實矩陣相似的有用和判別法.
推論1: 設給定 \(A \in M_n\). 則以下諸命題等價:
(a) \(A\) 與一個實矩陣相似.
(b) 對 \(A\) 的每個非零特征值 \(\lambda\) 以及每個 \(k=1,2,\cdots\), 分塊 \(J_k{\lambda}\) 以及 \(J_k{\bar{\lambda}}\) 各自的個數相等.
(c) 對 \(A\) 的每個非實特征值 \(\lambda\) 以及每個 \(k=1,2,\cdots\), 分塊 \(J_k{\lambda}\) 以及 \(J_k{\bar{\lambda}}\) 各自的個數相等.
(d) 對 \(A\) 的每個非實特征值 \(\lambda\) 以及每個 \(k=1,2,\cdots\), \(\mathrm{rank}\, (A-\lambda I)^k=\mathrm{rank}\,(A-\bar{\lambda}I)^k\).
(e) 對 \(A\) 的每個非實特征值 \(\lambda\) 以及每個 \(k=1,2,\cdots\), \(\mathrm{rank}\, (A-\lambda I)^k=\mathrm{rank}\,(\bar{A}-\lambda I)^k\).
(f) 對 \(A\) 的每個非實特征值 \(\lambda\), \(A\) 與 \(\lambda\) 以及與 \(\bar{\lambda}\) 相關的 Weyr 特征是相同的.
(g) \(A\) 與 \(\bar{A}\) 相似.
推論2: 如果 \(A = \begin{bmatrix} B & C \\ 0 & 0 \end{bmatrix} \in M_n\), 而 \(B \in M_m\) 與一個實矩陣相似,那么 \(A\) 與一個實矩陣相似.
證明:假設 \(S\in M_m\) 是非奇異的,且 \(SBS^{-1}=R\) 是實的. 那么 \(\mathcal{A} =(S \oplus I_{n-m})A(S \oplus I_{n-m})^{-1}= \begin{bmatrix} R & \bigstar \\ 0 & 0 \end{bmatrix}\) 與 \(A\) 相似. 現在只要證明 \(\mathcal{A}\) 與實矩陣相似就好了. 如果 \(\lambda \neq 0\), 那么
\begin{align}
(\mathcal{A}-\lambda I)^k = \begin{bmatrix} (R-\lambda I)^k & \bigstar \\ & (-\lambda)^k I_{n-m} \end{bmatrix} \notag
\end{align}
與
\begin{align}
(\bar{\mathcal{A}}-\lambda I)^k = \begin{bmatrix} (R-\lambda I)^k & \bigstar \\ & (-\lambda)^k I_{n-m} \end{bmatrix} \notag
\end{align}
的列秩相同:\(n-m+\mathrm{rank}(R-\lambda I)^k\). 我們斷言 \(\mathcal{A}\) 與 \(\bar{\mathcal{A}}\) 相似,所以 \(\mathcal{A}\) 與實矩陣相似.
推論3: 對每個 \(A\in M_n\), \(A\bar{A}\) 與 \(\bar{A}A\) 相似,也與一個實矩陣相似.
證明: \(A \bar{A}\) 與 \(\bar{A} A\) 的非奇異的 Jordan 構造是相同的. 由於矩陣與它的復共軛有同樣的秩,對每個 \(k=1,2,\cdots\) 有 \(\mathrm{rank} (A \bar{A})^k= \mathrm{rank} \overline{(A \bar{A})^k} = \mathrm{rank} \overline{(A \bar{A})}^k= \mathrm{rank} (\bar{A} A )^k\). 於是,\(A\bar{A}\) 與 \(\bar{A}A\) 的冪零部分的 Jordan 構造也是相同的,所以 \(A\bar{A}\) 與 \(\bar{A}A\) 相似. 由於 \(\bar{A}A=\overline{A \bar{A}}\), 所以 \(A \bar{A}\) 與一個實矩陣相似.
由 Schur 型知,每個復方陣 \(A\) 通過一個復相似而與一個復的上三角矩陣 \(T\) 相似. 如果 \(A\) 可以對角化,對么它通過一個復相似而與一個對角矩陣相似,且這個對角矩陣的對角元素與 \(T\) 的對角元素相同,這些元素就是 \(A\) 的特征值. 那么這個結論的實的類似結果 是什么?
每一個實方陣 \(A\) 通過一個實相似與一實的上擬三角矩陣 \(T\) 相似,其中任何 \(2 \times 2\) 對角分塊都有特殊的形式(\ref{e111}). 如果 \(A\) 可以對角化,則實 Jordan 標准型定理的如下推論就確保 \(A\) 通過一個實相似與一個實的擬對角矩陣相似,它的對角分塊與 \(T\) 的對角分塊相同.
推論4: 設給定 \(A\in M_n(\mathbb{R})\), 並假設它可以對角化. 設 \(\mu_1,\cdots, \mu_q\) 是 \(A\) 的實特征值,並設 \(a_1 + \mathrm{i} b_1, \cdots, a_1 + \mathrm{i} b_{\ell}\) 是 \(A\) 的非實特征值,其中每個 \(b_j >0\). 那么 \(A\) 通過一個實相似與
\begin{align}
C_1(a_1, b_1) \oplus \cdots \oplus C_1(a_{\ell}, b_{\ell}) \oplus [\mu_1] \oplus \cdots \oplus [\mu_q]
\end{align}
相似.
證明: 這是式 (\ref{e5}) 中 \(n_1 = \cdots =n_p=m_1=\cdots = m_r=1\) 的情形.
Weyr 標准型
基本定義
Weyr 特征在我們關於 Jordan 標准型的唯一性的討論中起着關鍵的作用,它還可以用來定義一種相似標准型. 我們先來定義 Weyr 分塊.
設給定 \(\lambda \in \mathbb{C}\), 設 \(q \geqslant 1\) 是給定的正整數,\(w_1 \geqslant \cdots \geqslant w_q \geqslant 1\) 是給定的由正整數組成的非增序列,又設 \(w_1=(w_1,\cdots,w_q)\). 與 \(\lambda\) 以及 \(w\) 相關的 Weyr 分塊 \(W(w,\lambda)\) 是上三角的 \(q \times q\) 分塊雙對角矩陣
\begin{align}
W(w,\lambda)=\begin{bmatrix} \lambda I_{w_1} & G_{w_1,w_2} &&& \\ & \lambda I_{w_2} & G_{w_2,w_3} && \\ && \ddots & \ddots & \\ &&& \ddots & G_{w_{q-1},w_q} \\ &&&& \lambda I_{w_q} \end{bmatrix}
\end{align}
其中
\begin{align} \label{e222}
G_{w_i,w_j}=\begin{bmatrix} I_{w_j} \\ 0 \end{bmatrix} \in M_{w_i,w_j}, \qquad 1 \leqslant i < j
\end{align}
注意到 \(\mathrm{rank}\, G_{w_i,w_j}=w_j\), 且如果 \(w_i=w_{i+1}\), 則有 \(G_{w_i,w_{i+1}}=I_{w_i}\).
Weyr 分塊 \(W(w,\lambda)\) 可以被看成為與 Jordan 分塊相似的 \(q \times q\) 分塊矩陣. 對角分塊是按照階的大小不增的次序排列的純量矩陣 \(\lambda I\), 而超對角線分塊是列滿秩的塊 \(\begin{bmatrix} I \\ 0 \end{bmatrix}\), 它的大小是由對角分塊的大小所決定的.
式 (\ref{e222}) 中 Weyr 分塊 \(W(w,\lambda)\) 的大小是 \(w_1+\cdots +w_q\), 由於 \(G_{w_i,w_{i+1}}\) 都是列滿秩的塊,所以
\begin{align}
\mathrm{rank}(W(w,\lambda)-\lambda I) = w_2 +\cdots + w_q
\end{align}
直接計算可驗證 \(G_{w_{k-1},w_k} G_{w_k,w_{k+1}}=G_{w_{k-1},w_{k+1}}\), 即
\begin{align}
\begin{bmatrix} I_{w_k} \\ 0_{w_{k-1}-w_k, w_k} \end{bmatrix} \begin{bmatrix} I_{w_{k+1}} \\ 0_{w_k-w_{k+1}, w_{k+1}} \end{bmatrix} = \begin{bmatrix} I_{w_{k+1}} \\ 0_{w_{k-1}-w_{k+1}, w_{k+1}} \end{bmatrix}
\end{align}
利用上式,我們發現
\begin{align}
(W(w,\lambda) - \lambda I)^2 = \begin{bmatrix} 0_{w_1} & 0 & G_{w_1,w_3} && \\ & 0_{w_2} & 0 & \ddots & \\ && 0_{w_3} & \ddots & G_{w_{q-2},w_q} \\ &&& \ddots & 0 \\ &&&& 0_{w_q} \end{bmatrix}
\end{align}
所以 \(\mathrm{rank}(W(w,\lambda)-\lambda I)^2 = w_3 +\cdots + w\_q\). 按照此規律可推出 \(\mathrm{rank}(W(w,\lambda)-\lambda I)^p = w_{p+1} +\cdots + w\_q\)(對每個 \(p=1,2,\cdots\)). 由此推出
\begin{align}
\mathrm{rank}(W(w,\lambda)-\lambda I)^{p-1} - \mathrm{rank}(W(w,\lambda)-\lambda I)^p = w_p, \quad p=1,\cdots ,q
\end{align}
所以 \(W(w,\lambda)\) 的與特征值 \(\lambda\) 相關和 Weyr 特征就是 \(w\). 由特征值指數的定義知, 式 (\ref{e222}) 中的對角分塊的個數(參數 \(q\))就是 \(\lambda\) 作為 \(W(w,\lambda)\) 的特征值的指數.
Weyr 矩陣是與不同的特征值對應的 Weyr 分塊的直和.
對任意給定的 \(A \in M_n\), 設 \(q\) 是 \(A\) 的特征值 \(\lambda\) 的指數,設 \(w_k=w_k(A,\lambda)(k=1,2,\cdots)\) 是 \(A\) 的與 \(\lambda\) 相關的 Weyr 特征,並定義 \(A\) 的與特征值 \(\lambda\) 相關的 Weyr 分塊是
\begin{align}
W_A(\lambda) = W(w(A,\lambda), \lambda)
\end{align}
Weyr 分塊 \(W_A(\lambda)\) 的大小是 \(\lambda\) 的代數重數.
為了加深理解,計算一個例子:
\begin{align}
W_J(0) = \begin{bmatrix} 0_6 & G_{6,5} & \\ & 0_5 & G_{5,2} \\ & & 0_2 \end{bmatrix} ,\quad W_{J}(0)^2 = \begin{bmatrix} 0_6 & 0_{6,5} & G_{6,2} \\ & 0_5 & 0_{5,2} \\ & & 0_2 \end{bmatrix} ,\quad W_J(0)^3 = 0
\end{align}
顯然,\(\mathrm{rank} W_{J}(0)=7=w_2+w_3\), 且 \(\mathrm{rank} W_{J}(0)^2=2=w_3\). \(W_{J}(0)\) 的與它(僅有的)特征值 \(0\) 相關的 Weyr 特征是 \((6,5,2)\).
Weyr 標准型定理
定理2(Weyr 標准型定理): 設給定 \(A\in M_n\), 又設 \(\lambda_1, \cdots, \lambda_d\) 是它的按照任意次序排列的不同的特征值. 則存在一個非奇異的 \(S \in M_n\), 且存在 Weyr 分塊 \(W_1,\cdots,W_d\), 使得 (a) \(W_j\) 的(僅有的)特征值是 \(\lambda_j\) (對每個\(j=1,\cdots,d\))以及 (b) \(A=S(W_1 \oplus \cdots \oplus W_d) S^{-1}\). Weyr 矩陣(\(A\) 與之相似)\(W_1 \oplus \cdots \oplus W_d\) 由 \(A\) 以及所列舉出的給定的不同的特征值唯一確定:對每個 \(j=1,\cdots,d\) 有 \(W_j=W_A(\lambda_j)\), 所以
\begin{align}
A=S \begin{bmatrix} W_A(\lambda_1) & & \\ & \ddots & \\ & & W_A(\lambda_d) \end{bmatrix} S^{-1}
\end{align}
如果 \(A\) 與一個 Weyr 矩陣相似,那么那個矩陣可以由 \(W_A = W_A(\lambda_1) \oplus \cdots \oplus W_A(\lambda_d)\) 通過它的直和項的一個排列而得到. 如果 \(A\) 是實的且僅有實的特征值,那么 \(S\) 可以選取為實的.
證明:先前的結論表明 \(W_A = W_A(\lambda_1) \oplus \cdots \oplus W_A(\lambda_d)\), 且對於它們的每一個不同的特征值,\(A\) 的與之相關的 Weyr 特征都是相同的. 由於 \(W_A\) 與 \(A\) 都是相似於相同的 Jordan 標准型,所以它們相似. 如果兩個 Weyr 矩陣相似,那么它們必定有同樣的不同的特征值,且對於每個特征值有相同的與之相關的 Weyr 特征;由此推出,它們有同樣的 Weyr 分塊,這些分塊在各自的直和中有不同的排列次序. 如果 \(A\) 與它的所有的特征值都是實的,則 \(W_A\) 是實的,且 \(A\) 與 \(W_A\) 通過一個實的相似而相似.
上個定理中的 Weyr 矩陣 \(W_A\) 就是 \(A\) 的 Weyr 標准型. Weyr 與 Jordan 標准型 \(W_A\) 與 \(J_A\) 包含了 \(A\) 的同樣的信息,不過各自是以不同的方式給出這些信息. Weyr 標准型以明顯地方式展示了 \(A\) 的 Weyr 特征,而 Jordan 標准型以明顯的方式展示了它的 Segre 特征. 此外 \(W_A\) 與 \(J_A\) 還是置換相似的.
應該學習到什么
- 實矩陣才有實的 Jordan 標准型
- 矩陣 \(A \in M_n\) 與一個實矩陣相似,等價於 \(A\) 與 \(\bar{A}\) 相似(因為它們有相同的實 Jordan 標准型)
- 對每個 \(A\in M_n\), \(A\bar{A}\) 與 \(\bar{A}A\) 相似,也與一個實矩陣相似.
- Weyr 分塊 \(W(w,\lambda)\) 由 Weyr 特征 \(w\) 完全決定
- Weyr 矩陣是與不同的特征值對應的 Weyr 分塊的直和
- Weyr 與 Jordan 標准型 \(W_A\) 與 \(J_A\) 包含了 \(A\) 的同樣的信息,且它們是置換相似的