第五大題 設 $A_1,\cdots,A_n$ 為兩兩乘法可交換的 2019 階實方陣, $f(x_1,\cdots,x_n)$ 是 $n$ 元實系數多項式. 令 $B=f(A_1,\cdots,A_n)$, 證明: 存在 $B$ 的某個特征值 $\lambda_0$, 使得方程 $f(x_1,\cdots,x_n)-\lambda_0=0$ 有一組實數解.
證明 先利用下面的引理證明本題的結論, 然后再證明引理. 由於 $A_1,\cdots,A_n$ 是兩兩乘法可交換的 2019 階實矩陣, 故由引理可知: 存在 $\lambda_1,\cdots,\lambda_n\in\mathbb{R}$ 和 $0\neq \alpha\in\mathbb{R}^{2019}$, 使得 $A_i\alpha=\lambda_i\alpha\,(1\leq i\leq n)$. 於是 $$B\alpha=f(A_1,\cdots,A_n)\alpha=f(\lambda_1,\cdots,\lambda_n)\alpha,$$ 從而 $\lambda_0=f(\lambda_1,\cdots,\lambda_n)$ 是 $B$ 的一個特征值, 方程 $f(x_1,\cdots,x_n)=\lambda_0$ 有一組實數解 $x_1=\lambda_1,\cdots,x_n=\lambda_n$. $\Box$
引理 設 $A_1,A_2,\cdots,A_n$ 為兩兩乘法可交換的 $m$ 階實方陣, 其中 $m$ 為奇數, 則 $A_1,A_2,\cdots,A_n$ 必有一個公共的實特征向量.
分析 高代教材第 270 頁的習題 9 或高代白皮書的例 6.25 告訴我們: 兩兩乘法可交換的一組復矩陣必有一個公共的復特征向量, 上述引理正是這一結論的實數域版本. 容易看出: 如果沒有奇數階的限制, 實數域版本的結論一般並不成立, 例如 $A_1=\begin{pmatrix} 0 & 1 \\ -1 & 0 \\ \end{pmatrix}$, $A_2=I_2$. 設兩個復方陣 $A,B$ 乘法可交換, 則 $A$ 的特征子空間必為 $B$ 的不變子空間 (將矩陣和線性變換等同起來), 這一基本結論是處理眾多 $AB=BA$ 型問題的出發點. 由高代白皮書例 6.25 的證明過程可知, 復數版本的證明方法是: 由基本結論可將 $A_2,\cdots,A_n$ 限制在 $A_1$ 的某個特征子空間上, 然后再對個數進行歸納即可. 如果將復數域版本的證明方法直接移植到實數域版本, 讀者不難發現: 奇數維實線性空間上的實線性變換, 它的實特征子空間不一定是奇數維的, 從而無法采用歸納法進行討論. 下面我們給出上述引理的三種證法 (證法一由桑元琦博士后提供, 證法二參考教學論文 [3] 的例 3, 證法三由復旦大學數學學院 11 級王晉民同學提供), 它們都能克服這一技術性的難點.
證明 對 $n$ 進行歸納. 當 $n=1$ 時, $A_1$ 是奇數階實矩陣, 其特征多項式是奇數次實系數多項式. 因為實系數多項式虛根成對出現, 故 $A_1$ 的特征多項式至少有一個實根, 即 $A_1$ 至少有一個實特征值, 從而至少有一個實特征向量. 設對 $n-1$ 個兩兩乘法可交換的奇數階實矩陣, 它們必有一個公共的實特征向量, 現考慮 $n$ 個兩兩乘法可交換的奇數階實矩陣的情形.
證法一 首先, $A_1$ 必有一個代數重數為奇數的實特征值. 否則, 若 $A_1$ 的所有實特征值的代數重數都為偶數, 又共軛虛特征值的代數重數相等, 從而 $A_1$ 的階數必為偶數, 矛盾! 設 $\lambda_1$ 是 $A_1$ 的實特征值, 其代數重數 $m_1$ 為奇數, 設 $A_1$ 的特征多項式 $f(\lambda)=|\lambda I_m-A_1|=(\lambda-\lambda_1)^{m_1}g(\lambda)$, 則 $(\lambda-\lambda_1)^{m_1}$ 與 $g(\lambda)$ 互素. 將實矩陣和實線性變換等同起來, 令 $$R_1=\mathrm{Ker}(A_1-\lambda_1I_m)^{m_1}\subseteq\mathbb{R}^m,\,\,\,\,K_1=\mathrm{Ker}g(A_1)\subseteq\mathbb{R}^m,$$ 則由高代白皮書的例 6.69 可知 $\mathbb{R}^m=R_1\oplus K_1$, 並且 $A_1$ 在不變子空間 $R_1$ 上的限制 $\widetilde{A_1}$ 的特征多項式就是 $(\lambda-\lambda_1)^{m_1}$. 特別地, $\dim R_1=m_1$, 即 $R_1$ 是一個奇數維實線性空間. 由 $A_1,A_2,\cdots,A_n$ 兩兩乘法可交換, 容易驗證 $R_1$ 也是 $A_2,\cdots,A_n$ 的不變子空間, 對 $A_2,\cdots,A_n$ 在 $R_1$ 上的限制 $\widetilde{A_2},\cdots,\widetilde{A_n}$ 利用歸納假設可知, 存在 $\lambda_2,\cdots,\lambda_n\in\mathbb{R}$, 使得 $\bigcap\limits_{i=2}^n\mathrm{Ker}(\widetilde{A_i}-\lambda_iI_{R_1})\neq 0$. 注意到 $\bigcap\limits_{i=2}^n\mathrm{Ker}(\widetilde{A_i}-\lambda_iI_{R_1})\subseteq R_1$ 是 $\widetilde{A_1}$-不變子空間, 並且 $\widetilde{A_1}$ 限制在 $\bigcap\limits_{i=2}^n\mathrm{Ker}(\widetilde{A_i}-\lambda_iI_{R_1})$ 上只有一個實特征值 $\lambda_1$, 從而存在對應的實特征向量 $\alpha\in\bigcap\limits_{i=2}^n\mathrm{Ker}(\widetilde{A_i}-\lambda_iI_{R_1})$, 於是 $\alpha$ 就是 $\widetilde{A_1},\widetilde{A_2},\cdots,\widetilde{A_n}$ (也即 $A_1,A_2,\cdots,A_n$) 公共的實特征向量.
證法二 設 $\lambda_1,\overline{\lambda_1},\cdots,\lambda_r,\overline{\lambda_r},\lambda_{r+1},\cdots,\lambda_k$ 為 $A_1$ 的全體不同特征值, 其中 $\lambda_1,\overline{\lambda_1},\cdots,\lambda_r,\overline{\lambda_r}$ 為共軛虛特征值, $\lambda_{r+1},\cdots,\lambda_k$ 為實特征值, 則由 Jordan 標准型理論可知 $$\mathbb{C}^m=R(\lambda_1)\oplus R(\overline{\lambda_1})\oplus\cdots\oplus R(\lambda_r)\oplus R(\overline{\lambda_r})\oplus R(\lambda_{r+1})\oplus\cdots\oplus R(\lambda_k),$$ 其中 $R(\lambda_i)$ 是特征值 $\lambda_i$ 的根子空間, $\dim R(\lambda_i)=m_i\,(1\leq i\leq k)$. 由矩陣秩的子式判別法可知, 復矩陣的秩在共軛下不改變, 故對任意的 $1\leq i\leq r$, $$\dim R(\lambda_i)=m-r((A_1-\lambda_iI_m)^{m_i})=m-r((A_1-\overline{\lambda_i}I_m)^{m_i})=\dim R(\overline{\lambda_i}).$$ 再由 $m$ 為奇數可知, 存在 $r+1\leq j\leq k$, 使得 $\dim R(\lambda_j)$ 為奇數. 不妨設 $\dim R(\lambda_k)=m_k$ 為奇數, 注意這是復線性子空間的復維數. 設 $$R_k=\{\alpha\in\mathbb{R}^m\mid (A_1-\lambda_kI_m)^{m_k}\alpha=0\}\subseteq\mathbb{R}^m,$$ 由矩陣秩的子式判別法可知, 矩陣的秩在基域擴張下不改變 (參考論文 [1]), 故 $$\dim_{\mathbb{R}} R_k=m-r_{\mathbb{R}}((A_1-\lambda_kI_m)^{m_k})=m-r_{\mathbb{C}}((A_1-\lambda_kI_m)^{m_k})=\dim_{\mathbb{C}} R(\lambda_k)=m_k,$$ 於是 $R_k$ 是一個奇數維的實線性空間. 將實矩陣和實線性變換等同起來, 由 $A_1,A_2,\cdots,A_n$ 兩兩乘法可交換, 容易驗證 $R_k$ 是 $A_2,\cdots,A_n$ 的不變子空間. 記 $A_2,\cdots,A_n$ 在 $R_k$ 上的限制為 $\widetilde{A_2},\cdots,\widetilde{A_n}$, 則由歸納假設可知, 它們存在公共的實特征向量, 即存在 $0\neq\beta\in R_k$, 使得 $A_i\beta=\mu_i\beta\,(2\leq i\leq n)$. 設 $$s=\max\{i\in\mathbb{Z}^{\geq 0}\mid (A_1-\lambda_kI_n)^i\beta\neq 0\},$$ 令 $\alpha=(A_1-\lambda_kI_n)^s\beta$, 則 $0\neq\alpha\in R_k$ 且 $(A_1-\lambda_kI_n)\alpha=(A_1-\lambda_kI_n)^{s+1}\alpha=0$, 即有 $A_1\alpha=\lambda_k\alpha$. 再由 $A_1$ 與 $A_2,\cdots,A_n$ 乘法可交換可知 $A_i\alpha=\mu_i\alpha\,(2\leq i\leq n)$, 於是 $\alpha$ 就是 $A_1,A_2,\cdots,A_n$ 公共的實特征向量.
證法三 先考慮 $A_1$ 復可對角化的情形. 設 $\lambda_1,\overline{\lambda_1},\cdots,\lambda_r,\overline{\lambda_r},\lambda_{r+1},\cdots,\lambda_k$ 為 $A_1$ 的全體不同特征值, 其中 $\lambda_1,\overline{\lambda_1},\cdots,\lambda_r,\overline{\lambda_r}$ 為共軛虛特征值, $\lambda_{r+1},\cdots,\lambda_k$ 為實特征值, 則由 $A_1$ 復可對角化可知 $$\mathbb{C}^m=V_{\lambda_1}\oplus V_{\overline{\lambda_1}}\oplus\cdots\oplus V_{\lambda_r}\oplus V_{\overline{\lambda_r}}\oplus V_{\lambda_{r+1}}\oplus\cdots\oplus V_{\lambda_k},$$ 其中 $V_{\lambda_i}$ 是特征值 $\lambda_i$ 的特征子空間. 由矩陣秩的子式判別法可知, 復矩陣的秩在共軛下不改變, 故對任意的 $1\leq i\leq r$, $$\dim V_{\lambda_i}=m-r(A_1-\lambda_iI_m)=m-r(A_1-\overline{\lambda_i}I_m)=\dim V_{\overline{\lambda_i}}.$$ 再由 $m$ 為奇數可知, 存在 $r+1\leq j\leq k$, 使得 $\dim V_{\lambda_j}$ 為奇數. 不妨設 $\dim V_{\lambda_k}$ 為奇數, 注意這是復線性子空間的復維數. 設 $$V_k=\{\alpha\in\mathbb{R}^m\mid (A_1-\lambda_kI_m)\alpha=0\}\subseteq\mathbb{R}^m,$$ 由矩陣秩的子式判別法可知, 矩陣的秩在基域擴張下不改變 (參考論文 [1]), 故 $$\dim_{\mathbb{R}} V_k=m-r_{\mathbb{R}}(A_1-\lambda_kI_m)=m-r_{\mathbb{C}}(A_1-\lambda_kI_m)=\dim_{\mathbb{C}} V_{\lambda_k},$$ 於是 $V_k$ 是一個奇數維的實線性空間. 將實矩陣和實線性變換等同起來, 由 $A_1,A_2,\cdots,A_n$ 兩兩乘法可交換, 容易驗證 $V_k$ 是 $A_2,\cdots,A_n$ 的不變子空間. 記 $A_2,\cdots,A_n$ 在 $V_k$ 上的限制為 $\widetilde{A_2},\cdots,\widetilde{A_n}$, 則由歸納假設可知, $\widetilde{A_2},\cdots,\widetilde{A_n}$ 存在公共的實特征向量 $\alpha\in V_k$, 從而 $\alpha$ 是 $A_1,A_2,\cdots,A_n$ 公共的實特征向量.
再處理一般的情形. 由 Jordan-Chevalley 分解定理, $A_1=B+C$, 其中 $B$ 為可對角化矩陣, $C$ 為冪零矩陣, $BC=CB$, 且 $B,C$ 均可表示為 $A$ 的多項式. 考慮到 $A_1$ 為實矩陣, 求共軛后可得 $A_1=\overline{B}+\overline{C}$, 易證這個分解仍滿足 Jordan-Chevalley 分解的條件. 由 Jordan-Chevalley 分解的唯一性可知, $\overline{B}=B$, $\overline{C}=C$, 即 $B,C$ 都是實矩陣 (也可以直接引用高代白皮書的例 7.69). 由於 $B$ 是 $A_1$ 的多項式, 故 $B,A_2,\cdots,A_n$ 是兩兩乘法可交換的奇數階實方陣, 由前面的討論可知, $B,A_2,\cdots,A_n$ 存在公共的實特征向量 $\beta$, 即有 $B\beta=\mu_1\beta$, $A_i\beta=\mu_i\beta\,(2\leq i\leq n)$. 設 $$s=\max\{i\in\mathbb{Z}^{\geq 0}\mid C^i\beta\neq 0\},$$ 令 $\alpha=C^s\beta$, 則 $0\neq\alpha\in\mathbb{R}^m$ 且 $C\alpha=C^{s+1}\beta=0$, $$B\alpha=BC^s\beta=C^sB\beta=\mu_1C^s\beta=\mu_1\alpha,$$ 從而 $A_1\alpha=B\alpha+C\alpha=\mu_1\alpha$. 由於 $C$ 是 $A_1$ 的多項式, 故 $C$ 與 $A_2,\cdots,A_n$ 乘法可交換, 從而 $$A_i\alpha=A_iC^s\beta=C^sA_i\beta=\mu_iC^s\beta=\mu_i\alpha\,(2\leq i\leq n),$$ 即 $\alpha$ 是 $A_1,A_2,\cdots,A_n$ 公共的實特征向量. $\Box$
點評 證法一和證法二的整體思路是一致的, 都是用實特征值的根子空間代替特征子空間進行討論, 但在證明根子空間的維數為奇數以及構造公共的實特征向量這兩個關鍵點上采用了不同的方法. 證法三利用 Jordan-Chevalley 分解定理把證明化簡為其中一個實矩陣復可對角化的情形, 從而仍然沿用特征子空間的討論方法, 最后在構造公共的實特征向量這個關鍵點上與證法二完全類似. 總的來說, 證法一只用了實線性變換理論, 從而證明過程最簡潔; 證法二和證法三都用了復矩陣的 Jordan 標准型理論 (包括 Jordan-Chevalley 分解定理), 並利用了矩陣秩在基域擴張下的不變性, 雖然證明過程有點長, 但給出了實矩陣和復矩陣之間的區別與聯系, 值得讀者細細品味.
最后, 我們給出一個推論, 它將引理從一組矩陣推廣為一族矩陣 (個數可以是無限個).
推論 設 $\{A_i\}_{i\in I}$ 是一族兩兩乘法可交換的復矩陣 (奇數階實矩陣), 則 $\{A_i\}_{i\in I}$ 必有一個公共的復 (實) 特征向量.
證明 令 $V=L(A_i,\,i\in I)$ 為這族矩陣張成的矩陣空間. 設 $\dim V=n$, $\{B_1,\cdots,B_n\}$ 為 $V$ 的一組基, 容易驗證: $B_1,\cdots,B_n$ 是一組兩兩乘法可交換的復矩陣 (奇數階實矩陣), 則由高代白皮書的例 6.25 (上述引理) 可知, $B_1,\cdots,B_n$ 有一個公共的復 (實) 特征向量, 從而 $\{A_i\}_{i\in I}$ 有一個公共的復 (實) 特征向量. $\Box$
參考文獻
[1] 高代教材: 姚慕生, 吳泉水, 謝啟鴻 編著, 高等代數學 (第三版), 復旦大學出版社, 2014.
[2] 高代白皮書: 姚慕生, 謝啟鴻 編著, 學習方法指導書: 高等代數 (第三版), 復旦大學出版社, 2015.
[3] 謝啟鴻, 高等代數中若干概念在基域擴張下的不變性, 大學數學, 2015, 31(6), 50–55.
