將學習到什么
就算兩個矩陣有相同的特征多項式,它們也有可能不相似,那么如何判斷兩個矩陣是相似的?答案是它們有一樣的 Jordan 標准型.
Jordan 標准型定理
這節目的:證明**每個復矩陣都與一個本質上唯一的 Jordan 矩陣相似**. 分三步證明這個結論。其中前兩步已經在其它章節中給出, - 第一步 [Schur 定理](http://www.cnblogs.com/zhoukui/p/7782688.html) 確保每個復矩陣都相似於一個上三角矩陣,這個上三角矩陣的特征值出現在其對角線上,且相等的特征值放在一起. - 第二步 [Schur 三角化定理推論](http://www.cnblogs.com/zhoukui/p/7786648.html) 中定理 1.3 確保第一步中所描述的那種形式的矩陣相似於一個分塊對角的上三角矩陣, 其中每個對角分塊都有相等的對角元素. - 第三步 在本節,要證明:**有相等對角元素的上三角矩陣相似於一個 Jordan 矩陣**.
同時我們還對如下結論感興趣:如果一個矩陣是實的,且只有實的特征值,那么它可以通過實相似化簡為 Jordan 矩陣. 如果實矩陣 \(A\) 只有實的特征值,那么第一步與第二步確保存在一個相似矩陣 \(S\), 使得 \(S^{-1}AS\) 是一個實的分塊對角的上三角矩陣. 於是,只要證明有相等主對角元素的實的上三角矩陣可以通過實相似化簡成 Jordan 塊的直和就足夠了.
下面給出一個有用的引理,它的證明完全是直接的計算. 特征值為零的 \(k \times k\) Jordan 塊稱為 冪零 Jordan 塊.


證明:如果 \(n=1\), 就有 \(A=[0]\), 故而結論是平凡的. 我們對 \(n\) 用歸納法. 假設 \(n>1\) 且結論對所有階小於 \(n\) 的所有嚴格上三角矩陣都成立. 分划 \(A=\begin{bmatrix} 0 & a^T \\ 0 & A_1 \end{bmatrix}\), 其中 \(a \in \mathbb{C}^{n-1}\), 且 \(A_1 \in M_{n-1}\) 是嚴格上三角矩陣. 根據歸納假設,存在一個非奇異的 \(S_1 \in M_{n-1}\), 使得 \(S_1^{-1}A_1S_1\) 有形式
\begin{align}
S_1^{-1}A_1S_1= \begin{bmatrix} J_{k_1} && \\ & \ddots & \\ && J_{k_s} \end{bmatrix} = \begin{bmatrix} J_{k_1} & 0 \\ 0 & J \end{bmatrix}
\end{align}
其中 \(k_1 \geqslant k_2 \geqslant \cdots \geqslant k_s \geqslant 1\) , \(k_1+k_2+\cdots+k_s=n-1\), \(J_{k_i}=J_{k_i}(0)\), 且 \(J=J_{k_2}\oplus \cdots \oplus J_{k_s} \in M_{n-k_1-1}\). \(J\) 中沒有大於 \(k_1\) 的對角塊,所以 \(J^{k_1}=0\). 計算表明
\begin{align} \label{e1}
\begin{bmatrix} 1 & 0 \\ 0 & S_1^{-1} \end{bmatrix} A \begin{bmatrix} 1 & 0 \\ 0 & S_1 \end{bmatrix} =\begin{bmatrix} 0 & a^TS_1 \\ 0 & S_1^{-1}A_1 S_1 \end{bmatrix}
\end{align}
分划 \(a^TS_1=[a_1^T \quad a_2^T]\), 其中 \(a_1 \in \mathbb{C}^{k_1}\). 而 \(a_2 \in \mathbb{C}^{n-k_1-1}\), 並將 \ref{e1} 寫成
\begin{align}
\begin{bmatrix} 1 & 0 \\ 0 & S_1^{-1} \end{bmatrix} A \begin{bmatrix} 1 & 0 \\ 0 & S_1 \end{bmatrix} =\begin{bmatrix} 0 & a_1^T & a_2^T \\ 0 & J_{k_1} & 0 \\ 0 & 0 & J \end{bmatrix}
\end{align}
現在考慮相似性
\begin{align}
& \begin{bmatrix} 1 & -a_1^T J_{k_1}^T & 0 \\ 0 & I & 0 \\ 0 & 0 & I \end{bmatrix} \begin{bmatrix} 0 & a_1^T & a_2^T \\ 0 & J_{k_1} & 0 \\ 0 & 0 & J \end{bmatrix} \begin{bmatrix} 1 & a_1^TJ_{k_1}^T & 0 \\ 0 & I & 0 \\ 0 & 0 & I \end{bmatrix} \notag \\ \label{e22}
&= \begin{bmatrix} 0 & a_1^T(I-J_{k_1}^TJ_{k_1}) & a_2^T \\ 0 & J_{k_1} & 0 \\ 0 & 0 & J \end{bmatrix}= \begin{bmatrix} 0 & (a_1^Te_1)e_1^T & a_2^T \\ 0 & J_{k_1} & 0 \\ 0 & 0 & J \end{bmatrix}
\end{align}
其中用到恆等式 \([I-J_k^T J_k]x=(x^Te_1)e_1\). 現在有兩種可能性,它們要根據 \(a_1^Te_1 \neq 0\) 還是 \(a_1^Te_1 = 0\) 而定.
如果 \(a_1^Te_1 \neq 0\), 那么
\begin{align}
& \begin{bmatrix} 1/a_1^Te_1 & 0 & 0 \\ 0 & I & 0 \\ 0 & 0 & (1/a_1^Te_1) I \end{bmatrix} \begin{bmatrix} 0 & (a_1^Te_1)e_1^T & a_2^T \\ 0 & J_{k_1} & 0 \\ 0 & 0 & J \end{bmatrix}
\begin{bmatrix} a_1^Te_1 & 0 & 0 \\ 0 & I & 0 \\ 0 & 0 & a_1^Te_1 I \end{bmatrix} \notag \\
&= \begin{bmatrix} 0 & e_1^T & a_2^T \\ 0 & J_{k_1} & 0 \\ 0 & 0 & J \end{bmatrix}= \begin{bmatrix} \tilde{J} & e_1a_2^T \\ 0 & J \end{bmatrix} \notag
\end{align}
注意到 \(\tilde{J}=\begin{bmatrix} 0 & e_1^T \\ 0 & J_{k_1} \end{bmatrix}=J_{k_1+1}(0)\). 由於 \(\tilde{J}e_{i+1}=e_i\)(對 \(i=1,2,\cdots,k_1\)), 計算表明
\begin{align}
\begin{bmatrix} I & e_2a_2^T \\ 0 & I \end{bmatrix} \begin{bmatrix} \tilde{J} & e_1a_2^T \\ 0 & J \end{bmatrix} \begin{bmatrix} I & -e_2a_2^T \\ 0 & I \end{bmatrix} =\begin{bmatrix} \tilde{J} & - \tilde{J} e_2a_2^T+e_1a_2^T+e_2a_2^TJ \\ 0 & J \end{bmatrix} = \begin{bmatrix} \tilde{J} & e_2a_2^T J \\ 0 & J \end{bmatrix} \notag
\end{align}
我們可以用遞推方式對 \(i=2,3,\cdots\) 計算相似矩陣序列
\begin{align}
\begin{bmatrix} I & e_{i+1}a_2^T J^{i-1} \\ 0 & I \end{bmatrix} \begin{bmatrix} \tilde{J} & e_i a_2^T J^{i-1} \\ 0 & J \end{bmatrix} \begin{bmatrix} I & -e_{i+1}a_2^T J^{i-1}\\ 0 & I \end{bmatrix} = \begin{bmatrix} \tilde{J} & e_{i+1}a_2^T J^i \\ 0 & J \end{bmatrix} \notag
\end{align}
由於 \(J^{k_1} = 0\),經過至多 \(k_1\) 步計算之后,這個相似矩陣序列中不在對角線上的元素最終都變為零. 我們得出結論: \(A\) 相似於 $ \begin{bmatrix} \tilde{J} & 0 \\ 0 & J \end{bmatrix} $, 它就是一個有所要求形狀的嚴格上三角 Jordan 矩陣.
如果 \(a_1^Te_1 = 0\), 則 \ref{e22} 表明 \(A\) 相似於
\begin{align}
\begin{bmatrix} 0 & 0 & a_2^T \\ 0 & J_{k_1} & 0 \\ 0 & 0 & J \end{bmatrix} \notag
\end{align}
它與
\begin{align} \label{e3}
\begin{bmatrix} J_{k_1} & 0 & 0 \\ 0 & 0 & a_2^T \\ 0 & 0 & J \end{bmatrix}
\end{align}
置換相似. 根據歸納假設,存在一個非奇異的 \(S_2 \in M_{n-k_1}\), 使得 \(S_2^{-1}\begin{bmatrix} 0 & a_2^T \\ 0 & J \end{bmatrix} S_2=\hat{J} \in M_{n-k_1}\) 是主對角線為零的 Jordan 矩陣. 這樣一來,矩陣 \ref{e3} , \(A\) 本身都與 \(\begin{bmatrix} J_{k_1} & 0 \\ 0 & \hat{J} \end{bmatrix}\) 相似,這就是所要求形式的 Jordan 矩陣,除了對角 Jordan 塊有可能不是按照其大小非增的次序排列. 如果需要的話,用分塊置換相似就產生出所需要的形式.
最后注意到,如果 \(A\) 是實的,那么這一證明中所有相似矩陣都是實的,所以 \(A\) 通過實相似與所要求形式的 Jordan 矩陣相似.
由於一般情形是冪零情形的簡單推論,所以定理 (1.1) 基本完成了第 3 步. 如果 \(A \in M_n\) 是所有對角元素都為 \(\lambda\) 的上三角矩陣,那么 \(A_0=A-\lambda I\) 就是一個嚴格上三角矩陣. 如果 \(S \in M_n\) 是非奇異的,且 \(S^{-1}A_0S\) 是冪零 Jordan 塊 \(J_{n_i}(0)\) 的直和,那么 \(S^{-1}AS=S^{-1}A_0S+\lambda I\) 就是特征值為 \(\lambda\) 的 Jordan 塊 \(J_{n_i}(\lambda)\) 的直和. 下面給出 Jordan 標准型定理 中的存在性結論.

定理 (1.2) 中的 Jordan 矩陣就是 \(A\) 的 Jordan 標准型(相差不過直和項的排列). 矩陣 \(J_k(\lambda),\lambda \in \mathbb{C},k=1,2,\cdots\) 是 相似的標准分塊. 兩個事實為理解 Jordan 標准型定理中的唯一性提供了關鍵思路:(1) 如果兩個矩陣都用同樣的純量矩陣來做平移,其相似性保持不變;(2) 秩是一個相似不變量.
一些重要結論
如果 \(A,B,S\in M_n\), \(S\) 是非奇異的,且 \(A=SBS^{-1}\), 那么對任何 \(\lambda\in \mathbb{C}\), 有 \(A-\lambda I=SBS^{-1}-\lambda SS^{-1}=S(B-\lambda I)S^{-1}\). 對每個 \(k=1,2,\cdots\), 矩陣 \((A-\lambda I)^k\) 與 \((B-\lambda I)^k\) 相似,當然它們的秩相等. 我們着手於與 \(A\) 相似的 Jordan 矩陣 \(B=J=J_{n_1}(\lambda_1) \oplus \cdots \oplus J_{n_q}(\lambda_q)\) 以及 \(\lambda\) 是 \(A\) 的一個特征值時的結論. 在對 \(J\) 的對角塊用置換相似作排列之后。可以假設 \(J=J_{m_1}(\lambda) \oplus \cdots \oplus J_{m_p}(\lambda)\oplus \hat{J}\), 其中的 Jordan 矩陣 \(\hat{J}\) 是異於 \(\lambda\) 的特征值對應的 Jordan 塊的直和. 這樣 \(A-\lambda I\) 就相似於
\begin{align}
J-\lambda I&=(J_{m_1}(\lambda)-\lambda I) \oplus \cdots \oplus (J_{m_p}(\lambda)-\lambda I)\oplus( \hat{J}-\lambda I) \notag \\
&=J_{m_1}(0) \oplus \cdots \oplus J_{m_p}(0)\oplus ( \hat{J}-\lambda I) \notag
\end{align}
它是 \(p\) 個不同階的冪零 Jordan 塊和一個非奇異 Jordan 矩陣 $ \hat{J}-\lambda I \in M_m$ 的直和, 其中 \(m=n-(m_1+\cdots+m_p)\). 此外,對每個 \(k=1,2,\cdots\), \((A-\lambda I)^k\) 與 $(J-\lambda I)^k=J_{m_1}(0)^k \oplus \cdots \oplus J_{m_p}(0)^k\oplus ( \hat{J}-\lambda I)^k $ 相似. 由於直和的秩等於各個直和項的秩之和,故而對每個 \(k=1,2,\cdots\), 我們有
\begin{align}
\mathrm{rank}\,(A-\lambda I)^k &=\mathrm{rank}\,(J-\lambda I)^k= \mathrm{rank}\, J_{m_1}(0)^k \oplus \cdots \oplus \mathrm{rank}\,J_{m_p}(0)^k \oplus \mathrm{rank}\, (\hat{J}-\lambda I)^k \notag \\ \label{equ444}
&=\mathrm{rank}\, J_{m_1}(0)^k \oplus \cdots \oplus \mathrm{rank} \, J_{m_p}(0)^k +m
\end{align}
冪零 Jordan 塊的冪的秩等於什么?\(J_{\ell}(0)\) 的第一列是零,而它的后 \(\ell-1\) 列是線性無關的(第一條超對角元素中僅有的非零元素是 1),所以 \(\mathrm{rank}\, J_{\ell}(0)=\ell-1\). \(J_{\ell}(0)^2\) 中僅有的非零元素是在第二條超對角線中的 1,所以它的前兩列都是零,它的后 \(\ell-2\) 列是線性無關的,且 \(\mathrm{rank}\, J_{\ell}(0)^2=\ell-2\). 隨着冪每提高一次,這些 1 就向上移動一條超對角線(所以為零的列的個數就增加 1,而秩則減少 1),直到 \(J_{\ell}(0)^{\ell-1}\) 時恰好只有一個非零的元素(在位置 \((1,\ell)\) 處),且 \(\mathrm{rank}\,J_{\ell}(0)^{\ell-1}=1=\ell-(\ell-1)\). 當然,對所有 \(k=\ell,\ell+1,\cdots\), 都有 \(J_{\ell}(0)^k=0\). 一般來說,對每個 \(k=1,2,\cdots\), 我們有 \(\mathrm{rank}\,J_{\ell}(0)^k=\max \{\ell-k,0\}\), 所以
\begin{align} \label{equ555}
\mathrm{rank}\,J_{\ell}(0)^{k-1}-\mathrm{rank}\,J_{\ell}(0)^k= \begin{cases} 1 \quad \text{如果} k \leqslant \ell \\ 0 \quad \text{如果} k>\ell \end{cases} ,\quad k=1,2,\cdots
\end{align}
其中我們標注 \(\mathrm{rank}\,J_{\ell}(0)^0=\ell\).
現在我們設 \(A\in M_n,\lambda \in \mathbb{C}\), 令 \(k\) 是一個正整數,設
\begin{align}
r_k(A,\lambda)=\mathrm{rank} \, (A-\lambda I)^k, \quad r_0(A,\lambda):=n
\end{align}
又定義
\begin{align}
w_k(A,\lambda)=r_{k-1}(A,\lambda)-r_k(A,\lambda), \quad w_1(A,\lambda)=n-r_1(A,\lambda)
\end{align}
如果 \(A\in M_n\), 且 \(\lambda \in \mathbb{C}\) 不是 \(A\) 的特征值,對所有 \(k=1,2,\cdots\), 有 \(w_k(A,\lambda)=0\). 考慮 Jordan 矩陣
\begin{align} \label{equ888}
J=J_3(0)\oplus J_3(0)\oplus J_2(0) \oplus J_2(0) \oplus J_2(0) \oplus J_1(0)
\end{align}
容易驗證 \(r_1(J,0)=7\), \(r_2(J,0)=2\) 以及 \(r_3(J,0)=r_4 (J,0)=0\), \(w_1(J,0)=6\) 是階至少為 1 的分塊的個數, \(w_2(J,0)=5\) 是階至少為 2 的分塊的個數, \(w_3(J,0)=2\) 是階至少為 3 的分塊的個數, \(w_4(J,0)=0\) 是階至少為 4 的分塊的個數。又注意到 \(w_1(J,0)-w_2(J,0)=1\) 是階為 1 的分塊的個數, \(w_2(J,0)-w_3(J,0)=3\) 是階為 2 的分塊的個數, \(w_3(J,0)-w_4(J,0)=2\) 是階為 3 的分塊的個數,這不是偶然的。
利用式 \ref{equ444} 和 \ref{equ555} 來說明 \(w_k(A,\lambda)\) 的代數意義:
\begin{align}
w_k (A,\lambda) &= \Big ( \mathrm{rank}\,J_{m_1}(0)^{k-1}-\mathrm{rank}\,J_{m_1}(0)^k \Big ) + \cdots + \Big ( \mathrm{rank}\,J_{m_p}(0)^{k-1}-\mathrm{rank}\,J_{m_p}(0)^k \Big) \notag \\
&=(1, \,\text{如果}\, m_1 \geqslant k)+ \cdots +(1, \,\text{如果} \, m_p \geqslant k) \notag \\ \label{equ666}
&= \text{特征值為}\, \lambda \,\, \text{且階至少為} \, k \,\, \text{的分塊的個數}
\end{align}
特別地,\(w_1(A,\lambda)\) 是 \(A\) 的以 \(\lambda\) 為特征值的所有各階的 Jordan 塊的個數,由定義知:\(w_1(A,\lambda)\) 也是 \(\lambda\) 作為 \(A\) 的特征值的幾何重數.
利用特征刻畫 \ref{equ666},我們看出 \(w_k(A,\lambda)-w_{k+1}(A,\lambda)\) 是以 \(\lambda\) 為特征值而階至少為 \(k\) 且不含階至少為 \(k+1\) 的 Jordan 塊的個數,這也就是以 \(\lambda\) 為特征值且階恰好為 \(k\) 的 Jordan 塊的個數.
由秩恆等式 \ref{equ444} 知,用 \(q\) 表示 \(A\in M_n\) 的以 \(\lambda \in \mathbb{C}\) 為特征值的最大的 Jordan 塊的階,則當 \(k \geqslant q\) 時,都有 \(\mathrm{rank} \, (A-\lambda I)^k=\mathrm{rank} \, (A-\lambda I)^q\), 這個整數 \(q\) 稱為 \(\lambda\) 作為 \(A\) 的特征值的指數. \(w_1(A,\lambda)+w_2(A,\lambda)+\cdots+w_q(A,\lambda)\) 是 \(\lambda\) 的代數重數.
Weyr 特征
\(A\in M_n\) 的與 \(\lambda \in \mathbb{C}\) 相關的 Weyr 特征定義為
\begin{align}
w(A,\lambda)=(w_1(A,\lambda),\cdots,w_q(A,\lambda))
\end{align}
其中 \(q\) 是 \(\lambda\) 作為 \(A\) 的特征值的指數.
如前所述,與 \(A\) 相似的 Jordan 矩陣 \(J\) 的構造完全由 \(A\) 的與不同的特征值相關的 Weyr 特征所決定的,這就意味着兩個本質上不同的 Jordan 矩陣不可能都與 \(A\) 相似,因為它們的 Weyr 特征必定是不相同的. 我們可以說:兩個復方陣 \(A,B\in M_n\) 相似,當且僅當它們特征值相同,且每個特征值相關的 Weyr 特征相同.
Segre 特征
對 \(A\) 的每個不同的特征值 \(\lambda\),列出 \(A\) 的以 \(\lambda\) 為特征值的所有 Jordan 塊的階,則給定的 \(A\in M_n\) 的 Jordan 塊構造就可以完全確定. 將 \(A\) 的以 \(\lambda\) 為特征值的 Jordan 塊的階按照非增次序排列而成的表
\begin{align}
s_1(A,\lambda) \geqslant s_2(A,\lambda) \geqslant \cdots \geqslant s_{w_1(A,\lambda)}(A,\lambda) >0= s_{w_1(A,\lambda)+1}(A,\lambda) =\cdots
\end{align}
稱為 \(A\) 的特征值 \(\lambda\) 想關的 \(Segre\) 特征. 注意到 \(s_1(A,\lambda)\) 是 \(\lambda\) 作為 \(A\) 的特征值的指數,而 \(s_{w_1}(A,\lambda)\) 是 \(A\) 的以 \(\lambda\) 為特征值的最小的 Jordan 塊的階. 如矩陣 \ref{equ888} 的與零這個特征值相關的 Segre 特征是 \(3,3,2,2,2,1\), \(s_1(J,0)=3\) 以及 \(s_6(J,0)=1\). 如果已知 Segre 特征,那么 Weyr 特征就容易得出,反之亦然.
應該知道什么
- 每個復矩陣都與一個本質上唯一的 Jordan 矩陣相似
- Weyr 特征與 Segre 特征及其元素代表的意義
