Jordan 標准型的應用是高等代數教學中的難點, 也是考試中的熱點, 其中應用最廣泛的技巧, 應該是所謂的三段論法: 即若矩陣問題的條件和結論在相似關系下不改變, 則可以先證明結論對 Jordan 塊成立; 再證明對 Jordan 標准型成立; 最后證明對一般的矩陣也成立. 如下例題是運用三段論法證明矩陣問題的典型例子.
例題 (高代白皮書的例 7.44) 設 $B$ 為 $n$ 階非異復方陣, 證明: 對任意的正整數 $m$, 存在 $n$ 階復方陣 $A$, 使得 $A^m=B$.
證明 設 $P$ 為非異陣, 使得 $P^{-1}BP=J=\mathrm{diag}\{J_{r_1}(\lambda_1),J_{r_2}(\lambda_2),\cdots,J_{r_k}(\lambda_k)\}$ 為 $B$ 的 Jordan 標准型. 由於 $B$ 非異, 故 $B$ 的所有特征值都非零.
第一步 對 $B$ 的任一 Jordan 塊 $J_{r_i}(\lambda_i)$, 取定 $\lambda_i$ 的某個 $m$ 次方根 $\mu_i$, 即 $\mu_i^m=\lambda_i$. 我們利用測試矩陣的技巧, 即采用 Jordan 塊 $J_{r_i}(\mu_i)$ 作為 $m$ 次方根的測試. 注意到 $$J_{r_i}(\mu_i)^m=\begin{pmatrix} \lambda_i & m\mu_i^{m-1} & * & \cdots & * \\ & \lambda_i & m\mu_i^{m-1} & \cdots & * \\ & & \ddots & \ddots & \vdots \\ & & & \ddots & m\mu_i^{m-1} \\ & & & & \lambda_i \\ \end{pmatrix}$$ 是一個上三角陣, 其特征值全為 $\lambda_i$. 由於 $m\mu_i^{m-1}\neq 0$, 故特征值 $\lambda_i$ 的幾何重數等於 $r_i-r(J_{r_i}(\mu_i)^m-\lambda_iI_{r_i})=1$, 於是 $J_{r_i}(\mu_i)^m$ 只有一個 Jordan 塊, 從而 $J_{r_i}(\mu_i)^m$ 相似於 $J_{r_i}(\lambda_i)$, 即存在非異陣 $Q_i$, 使得 $J_{r_i}(\lambda_i)=Q_i^{-1}J_{r_i}(\mu_i)^mQ_i=(Q_i^{-1}J_{r_i}(\mu_i)Q_i)^m$.
第二步 令 $C=\mathrm{diag}\{Q_1^{-1}J_{r_1}(\mu_1)Q_1,Q_2^{-1}J_{r_2}(\mu_2)Q_2,\cdots,Q_k^{-1}J_{r_k}(\mu_k)Q_k\}$, 則有 $J=C^m$.
第三步 因此, $B=PJP^{-1}=PC^mP^{-1}=(PCP^{-1})^m$, 令 $A=PCP^{-1}$, 則有 $B=A^m$. $\Box$
運用三段論法和測試矩陣這兩種技巧的更多例題,請讀者參考高代白皮書的第 7.2.8 節或高代習題課教學視頻中的"Jordan 標准型的應用"這一講. 下面是復旦大學數學學院 19 級高等代數 II 期中考試第七大題, 我們將給出兩種證法, 分別是應用上述例題的證明過程 (由王麗莉博士后提供) 以及運用測試矩陣的技巧, 但這里是將廣義 Jordan 塊作為測試矩陣.
第七大題 設 $a,b$ 都是實數, 其中 $b\neq 0$, 證明: 對任意的正整數 $m$, 存在 4 階實方陣 $A$, 使得 $$A^m=B=\begin{pmatrix} a & b & 2 & 0 \\ -b & a & 2 & 0 \\ 0 & 0 & a & b \\ 0 & 0 & -b & a \\ \end{pmatrix}.$$
證明 顯然, $B$ 的特征多項式 $f(\lambda)=((\lambda-a)^2+b^2)^2$. 我們可用三種方法求出 $B$ 的 Jordan 標准型 (參考高代白皮書的第 7.2.6 節). 第一種方法是計算行列式因子: $$\lambda I_4-B=\begin{pmatrix} \lambda-a & -b & -2 & 0 \\ b & \lambda-a & -2 & 0 \\ 0 & 0 & \lambda-a & -b \\ 0 & 0 & b & \lambda-a \end{pmatrix},$$ 經計算可知 $$(\lambda I_4-B)\begin{pmatrix} 1 & 2 & 3 \\ 1 & 2 & 4 \\ \end{pmatrix}=-b((\lambda-a)^2+b^2),\,\,(\lambda I_4-B)\begin{pmatrix} 1 & 2 & 3 \\ 2 & 3 & 4 \\ \end{pmatrix}=-2b(\lambda-a+b).$$ 顯然這兩個 3 階子式互素, 故 3 階行列式因子 $D_3(\lambda)=1$, 於是 $B$ 的行列式因子組和不變因子組均為 $1,1,1,((\lambda-a)^2+b^2)^2$, 從而初等因子組為 $(\lambda-a-b\mathrm{i})^2$, $(\lambda-a+b\mathrm{i})^2$, 因此 $B$ 的 Jordan 標准型 $J=\mathrm{diag}\{J_2(a+b\mathrm{i}),J_2(a-b\mathrm{i})\}$. 第二種方法是計算極小多項式: 由於 $B$ 是實方陣, 故其極小多項式 $m(\lambda)$ 是實系數多項式, 又 $m(\lambda)$ 整除 $f(\lambda)$, 從而只能是 $m(\lambda)=(\lambda-a)^2+b^2$ 或 $m(\lambda)=((\lambda-a)^2+b^2)^2$. 通過簡單的計算可知 $B$ 不適合多項式 $(\lambda-a)^2+b^2$, 於是 $m(\lambda)=f(\lambda)=((\lambda-a)^2+b^2)^2$, 剩余的討論同第一種方法. 第三種方法是計算特征值的幾何重數: $B$ 的全體特征值為 $a+b\mathrm{i}$ (2 重), $a-b\mathrm{i}$ (2 重), 通過簡單的計算可知 $r(B-(a+b\mathrm{i})I_4)=3$ 以及 $r(B-(a-b\mathrm{i})I_4)=3$, 於是 $a\pm b\mathrm{i}$ 的幾何重數都等於 1, 從而分別只有一個 2 階 Jordan 塊, 因此 $B$ 的 Jordan 標准型 $J=\mathrm{diag}\{J_2(a+b\mathrm{i}),J_2(a-b\mathrm{i})\}$.
下面給出兩種證法. 第一種證法是構造性證明, 其想法就是把上述例題的證明過程精細化 (注意不能直接引用上述例題的結論, 因為那里的 $A$ 不一定是實方陣); 第二種證法是存在性證明, 其思路就是利用廣義 Jordan 塊來做測試矩陣.
證法一 設 $\lambda_1=a+b\mathrm{i}$, 則 $\overline{\lambda}_1=a-b\mathrm{i}$. 我們先來確定過渡矩陣 $P$. 設 $\alpha_1,\alpha_2$ 是 $B$ 關於特征值 $\lambda_1$ 的特征向量和廣義特征向量, 即滿足 $$(1)\quad B\alpha_1=\lambda_1\alpha_1,\,\,B\alpha_2=\alpha_1+\lambda_1\alpha_2.$$ 注意到 $B$ 是實方陣, 將 (1) 式取共軛后可得 $$(2)\quad B\overline{\alpha}_1=\overline{\lambda}_1\overline{\alpha}_1,\,\,B\overline{\alpha}_2=\overline{\alpha}_1+\overline{\lambda}_1\overline{\alpha}_2.$$ 由於 $\{\alpha_1,\alpha_2\}$ 構成了根子空間 $R(\lambda_1)$ 的一組基, 容易驗證 $\overline{\alpha}_1,\overline{\alpha}_2$ 在復數域上線性無關, 再由 (2) 式可知 $\{\overline{\alpha}_1,\overline{\alpha}_2\}$ 構成了根子空間 $R(\overline{\lambda}_1)$ 的一組基. 由於 $\mathbb{C}^4=R(\lambda_1)\oplus R(\overline{\lambda}_1)$, 故 $\{\alpha_1,\alpha_2,\overline{\alpha}_1,\overline{\alpha}_2\}$ 是 $\mathbb{C}^4$ 的一組基. 令 $P=(\alpha_1,\alpha_2,\overline{\alpha}_1,\overline{\alpha}_2)$, 則 $P$ 是非異陣, 使得 $$P^{-1}BP=J=\mathrm{diag}\{J_2(\lambda_1),J_2(\overline{\lambda}_1)\}.$$ 由於 Jordan 塊是 2 階的, 故不需要引入測試矩陣, 直接通過簡單的計算就能得到其 $m$ 次方根. 設 $\mu_1$ 是 $\lambda_1$ 的 $m$ 次方根, 即滿足 $\mu_1^m=\lambda_1$ (取定一個即可). 令 $$K_2(\mu_1)=\begin{pmatrix} \mu_1 & \dfrac{1}{m}\mu_1^{1-m} \\ 0 & \mu_1 \\ \end{pmatrix},$$ 則 $K_2(\mu_1)$ 是 $J_2(\lambda_1)$ 的 $m$ 次方根, 即滿足 $K_2(\mu_1)^m=J_2(\lambda_1)$. 同理 $K_2(\overline{\mu}_1)^m=J_2(\overline{\lambda}_1)$. 令 $C=\mathrm{diag}\{K_2(\mu_1),K_2(\overline{\mu}_1)\}$, 則 $C^m=\mathrm{diag}\{J_2(\lambda_1),J_2(\overline{\lambda}_1)\}=J$. 令 $A=PCP^{-1}$, 則 $$A^m=(PCP^{-1})^m=PC^mP^{-1}=PJP^{-1}=B,$$ 即 $A$ 是 $B$ 的 $m$ 次方根. 最后, 我們還需驗證 $A$ 的確是實方陣. 令 $T=\begin{pmatrix} O & I_2 \\ I_2 & O \\ \end{pmatrix}$, 則容易驗證 $T=T'=T^{-1}$, $\overline{P}=PT$ 且 $T\overline{C}T=C$. 於是 $$\overline{A}=\overline{PCP^{-1}}=\overline{P}\overline{C}\overline{P}^{-1}=PT\overline{C}T^{-1}P^{-1}=PCP^{-1}=A,$$ 即 $A$ 是實方陣.
證法二 取 $a+b\mathrm{i}$ 的 $m$ 次方根 $c+d\mathrm{i}$ ($c,d\in\mathbb{R}$), 即滿足 $(c+d\mathrm{i})^m=a+b\mathrm{i}$ (取定一個即可). 構造實方陣 (取法不唯一): $$C=\begin{pmatrix} c & d & 2 & 0 \\ -d & c & 2 & 0 \\ 0 & 0 & c & d \\ 0 & 0 & -d & c \\ \end{pmatrix},\,\,\hbox{或}\,\,C=\begin{pmatrix} c & d & 1 & 0 \\ -d & c & 0 & 1 \\ 0 & 0 & c & d \\ 0 & 0 & -d & c \\ \end{pmatrix},\,\,\hbox{或}\,\,C=\begin{pmatrix} c & d & 0 & 0 \\ -d & c & 1 & 0 \\ 0 & 0 & c & d \\ 0 & 0 & -d & c \\ \end{pmatrix}.$$ 注意到 $d\neq 0$, 則由開始處完全類似的討論可知, $C$ 的 Jordan 標准型為 $\mathrm{diag}\{J_2(c+d\mathrm{i}),J_2(c-d\mathrm{i})\}$. 由高代白皮書的例 7.35 可知, $J_2(c\pm d\mathrm{i})^m$ 的 Jordan 標准型為 $J_2(a\pm b\mathrm{i})$, 從而 $C^m$ 的 Jordan 標准型為 $\mathrm{diag}\{J_2(a+b\mathrm{i}),J_2(a-b\mathrm{i})\}$, 於是 $B$ 與 $C^m$ 有相同的 Jordan 標准型, 故它們在復數域上相似. 然而 $B$ 與 $C^m$ 都是實矩陣, 故由高代教材的推論 7.3.4 (矩陣相似在基域擴張下的不變性) 可知, 它們在實數域上也相似, 即存在非異陣 $P\in M_4(\mathbb{R})$, 使得 $B=P^{-1}C^mP=(P^{-1}CP)^m$. 令 $A=P^{-1}CP$, 則 $A$ 為實方陣, 滿足 $A^m=B$. $\Box$
接下去我們給出三個推廣, 第一個推廣是: 實數域上的兩類廣義 Jordan 塊都存在 $m$ 次方根. 事實上, 第七大題證法二中測試矩陣 $C$ 的后兩種取法就是實數域上的兩類廣義 Jordan 塊 (參考高代白皮書第 366 頁).
推廣 1 設 $a,b$ 都是實數, 其中 $b\neq 0$. 設 $S=\begin{pmatrix} a & b \\ -b & a \\ \end{pmatrix}$, $T=I_2$ 或 $T=\begin{pmatrix} 0 & 0 \\ 1 & 0 \\ \end{pmatrix}$. 證明: 對任意的正整數 $m$, 存在 $2n$ 階實方陣 $A$, 使得 $$A^m=J_n(a,b)=\begin{pmatrix} S & T & & & \\ & S & T & & \\ & & \ddots & \ddots & \\ & & & \ddots & T \\ & & & & S \\ \end{pmatrix}.$$
證明 取 $a+b\mathrm{i}$ 的 $m$ 次方根 $c+d\mathrm{i}$ ($c,d\in\mathbb{R}$), 即滿足 $(c+d\mathrm{i})^m=a+b\mathrm{i}$ (取定一個即可). 設 $R=\begin{pmatrix} c & d \\ -d & c \\ \end{pmatrix}$, 令 $$J_n(c,d)=\begin{pmatrix} R & T & & & \\ & R & T & & \\ & & \ddots & \ddots & \\ & & & \ddots & T \\ & & & & R \\ \end{pmatrix}.$$ 根據高代白皮書的例 7.68 (實數域上的廣義 Jordan 標准型理論) 的證明過程可知, $J_n(a,b)$ 的不變因子組為 $1,\cdots,1,((\lambda-a)^2+b^2)^n$, 從而 $J_n(a,b)$ 在復數域上的初等因子為 $(\lambda-a-b\mathrm{i})^n$, $(\lambda-a+b\mathrm{i})^n$, 於是 $J_n(a,b)$ 的 Jordan 標准型為 $\mathrm{diag}\{J_n(a+b\mathrm{i}),J_n(a-b\mathrm{i})\}$. 同理由 $d\neq 0$ 可知, $J_n(c,d)$ 的 Jordan 標准型為 $\mathrm{diag}\{J_n(c+d\mathrm{i}),J_n(c-d\mathrm{i})\}$. 由高代白皮書的例 7.35 可知, $J_n(c\pm d\mathrm{i})^m$ 的 Jordan 標准型為 $J_n(a\pm b\mathrm{i})$, 從而 $J_n(c,d)^m$ 的 Jordan 標准型為 $\mathrm{diag}\{J_n(a+b\mathrm{i}),J_n(a-b\mathrm{i})\}$, 於是 $J_n(a,b)$ 與 $J_n(c,d)^m$ 有相同的 Jordan 標准型, 故它們在復數域上相似. 然而 $J_n(a,b)$ 與 $J_n(c,d)^m$ 都是實矩陣, 故由高代教材的推論 7.3.4 (矩陣相似在基域擴張下的不變性) 可知, 它們在實數域上也相似, 即存在非異陣 $P\in M_{2n}(\mathbb{R})$, 使得 $J_n(a,b)=P^{-1}J_n(c,d)^mP=(P^{-1}J_n(c,d)P)^m$. 令 $A=P^{-1}J_n(c,d)P$, 則 $A$ 為實方陣, 滿足 $A^m=B$. $\Box$
注 我們也可以利用與第七大題證法一類似的討論來證明推廣 1, 請感興趣的讀者自行完成相關的細節.
第二個是第七大題的推廣.
推廣 2 設 $a,b$ 都是實數, 其中 $b\neq 0$, 設 $S=\begin{pmatrix} a & b \\ -b & a \\ \end{pmatrix}$. 證明: 對任意的正整數 $m$, 存在 $2n$ 階實方陣 $A$, 使得 $$A^m=B=\begin{pmatrix} S & * & * & \cdots & * \\ & S & * & \cdots & * \\ & & \ddots & \ddots & \vdots \\ & & & \ddots & * \\ & & & & S \\ \end{pmatrix}.$$
證明 顯然, $B$ 的特征多項式 $f(\lambda)=((\lambda-a)^2+b^2)^n$, 故不妨設 $B$ 在實數域上的初等因子組為 $((\lambda-a)^2+b^2)^{r_1}$, $((\lambda-a)^2+b^2)^{r_2}$, $\cdots$, $((\lambda-a)^2+b^2)^{r_k}$. 由實數域上的廣義 Jordan 標准型理論 (高代白皮書的例 7.68) 可知, 存在非異陣 $P\in M_{2n}(\mathbb{R})$, 使得 $$P^{-1}BP=\mathrm{diag}\{J_{r_1}(a,b),J_{r_2}(a,b),\cdots,J_{r_k}(a,b)\}.$$ 再由推廣 1 可知, 存在 $C_i\in M_{2r_i}(\mathbb{R})$, 使得 $J_{r_i}(a,b)=C_i^m$. 令 $C=\mathrm{diag}\{C_1,C_2,\cdots,C_k\}$, 則有 $P^{-1}BP=C^m$, 從而 $B=PC^mP^{-1}=(PCP^{-1})^m$. 令 $A=PCP^{-1}$, 則 $A$ 為實方陣, 滿足 $A^m=B$. $\Box$
第三個是一開始的例題 (高代白皮書的例 7.44) 在實數域上的推廣.
推廣 3 設 $B$ 為 $n$ 階非異實方陣, $m$ 為正整數, 滿足: 對 $B$ 的任一實特征值 $\lambda_i$, 都存在實數 $\mu_i$, 使得 $\mu_i^m=\lambda_i$. 證明: 存在 $n$ 階實方陣 $A$, 使得 $A^m=B$.
注 以下三種情形均可使條件得到滿足:
(i) $B$ 只有虛特征值, 沒有實特征值;
(ii) $m$ 是奇數;
(iii) 當 $m$ 是偶數時, $B$ 的所有實特征值都是正實數.
證明 設 $B$ 在實數域上的初等因子組為 $(\lambda-\lambda_1)^{r_1}$, $\cdots$, $(\lambda-\lambda_k)^{r_k}$, $((\lambda-a_1)^2+b_1^2)^{s_1}$, $\cdots$, $((\lambda-a_l)^2+b_l^2)^{s_l}$, 其中 $\lambda_1,\cdots,\lambda_k$, $a_1,b_1,\cdots,a_l,b_l$ 都是實數, $b_1,\cdots,b_l$ 都非零. 由實數域上的廣義 Jordan 標准型理論 (高代白皮書的例 7.68) 可知, 存在非異陣 $P\in M_n(\mathbb{R})$, 使得 $$P^{-1}BP=\mathrm{diag}\{J_{r_1}(\lambda_1),\cdots,J_{r_k}(\lambda_k),J_{s_1}(a_1,b_1),\cdots,J_{s_l}(a_l,b_l)\}.$$ 由題目條件, 對任一實特征值 $\lambda_i$, 都存在實數 $\mu_i$, 使得 $\mu_i^m=\lambda_i\,(1\leq i\leq k)$. 由一開始的例題第一步的討論可知, $J_{r_i}(\mu_i)^m$ 相似於 $J_{r_i}(\lambda_i)$, 但它們都是實矩陣, 故在實數域上相似, 於是存在非異實方陣 $Q_i$, 使得 $J_{r_i}(\lambda_i)=Q_i^{-1}J_{r_i}(\mu_i)^mQ_i=(Q_i^{-1}J_{r_i}(\mu_i)Q_i)^m$. 令 $B_i=Q_i^{-1}J_{r_i}(\mu_i)Q_i$, 則 $B_i$ 為實方陣, 滿足 $J_{r_i}(\lambda_i)=B_i^m\,(1\leq i\leq k)$. 再由推廣 1 可知, 存在實方陣 $C_j$, 滿足 $J_{s_j}(a_j,b_j)=C_j^m\,(1\leq j\leq l)$. 令 $C=\mathrm{diag}\{B_1,\cdots,B_k,C_1,\cdots,C_l\}$, 則 $C$ 為實方陣, 滿足 $P^{-1}BP=C^m$, 從而 $B=PC^mP^{-1}=(PCP^{-1})^m$. 令 $A=PCP^{-1}$, 則 $A$ 為實方陣, 滿足 $A^m=B$. $\Box$
注 如果 $B$ 有負的實特征值, 那么其 $m$ 次方根的存在性會變得比較復雜. 例如, $B=-I_2$ 有平方根 $A=\pm\begin{pmatrix} 0 & 1 \\ -1 & 0 \\ \end{pmatrix}$, 但 $B=\mathrm{diag}\{J_2(-1),J_3(-1)\}$ 卻沒有平方根. 請感興趣的讀者自行證明后面那個斷言.
參考文獻
[1] 高代教材: 姚慕生, 吳泉水, 謝啟鴻 編著, 高等代數學 (第三版), 復旦大學出版社, 2014.
[2] 高代白皮書: 姚慕生, 謝啟鴻 編著, 學習方法指導書: 高等代數 (第三版), 復旦大學出版社, 2015.
[3] 謝啟鴻, 復旦大學高等代數習題課教學視頻, https://www.bilibili.com/video/av90771191/