將學習到什么
介紹了極小多項式和友矩陣的相關概念以及基礎性質。
極小多項式
多項式 \(p(t)\) 稱為使 \(A\in M_n\) 零化,如果 \(p(A)=0\). Cayley-Hamilton 定理保證了:對每個 \(A \in M_n\), 存在一個 \(n\) 次的首 1 多項式 \(p_A(t)\)(特征多項式),使得 \(p_A(A)=0\). 當然可能也存在一個更低次數的首 1 多項式使 \(A\) 零化. 我們要找出使 \(A\) 零化的最低次數的首 1 多項式. 下面這個定理表明這個要找的多項式是唯一的.
定理 1: 設給定 \(A \in M_n\). 則存在唯一一個最小次數的首 1 多項式 \(q_A(t)\) 使 \(A\) 零化. \(q_A(t)\) 的次數至多為 \(n\). 如果 \(p(t)\) 是任何一個使 \(p(A)=0\) 成立的首 1 多項式,那么 \(q_A(t)\) 整除 \(p(t)\), 即對某個首 1 多項式 \(h(t)\) 有 \(p(t)=h(t)q_A(t)\).
證明:次數不大於 \(n\) 沒什么好說的,因為存在 \(n\) 次的一定滿足. 如果 \(p(t)\) 是任何一個使 \(A\) 零化的首 1 多項式,又如果 \(q(t)\) 是一個使 \(A\) 零化的 \(m\) 次(設為最低次)首 1 多項式,那么 \(p(t)\) 的次數是 \(m\) 或者更高. Euclid 算法確保存在一個首 1 多項式 \(h(t)\) 以及一個次數嚴格小於 \(m\) 的多項式 \(r(t)\) 使得 \(p(t)=q(t)h(t)+r(t)\). 但是 \(0=p(A)=q(A)h(A)+r(A)=0h(A)+r(A)\), 所以 \(r(A)=0\). 如果 \(r(t)\) 不是零多項式,我們就能將它規范化得到一個次數小於 \(m\) 的首 1 零化多項式,這是一個矛盾. 所以 \(r(t)\) 是零多項式,從而 \(q(t)\) 整除 \(p(t)\), 商為 \(h(t)\). 如果存在兩個最小次數的使 \(A\) 零化的首 1 多項式,這個論證表明它們每一個都整除另外一個,由於它們次數相同,其中一個必定是另一個的純量倍數. 但由於兩者都是首 1 的,純量因子必為 \(+1\), 從而它們是相等的.
定義 1: 設給定 \(A\in M_n\). 使 \(A\) 零化的唯一的最小次數首 1 多項式 \(q_A(t)\) 稱為 \(A\) 的極小多項式.
推論 1: 相似矩陣有相同的極小多項式
證明: 如果 \(A,B,S \in M_n\), 且 \(A=SBS^{-1}\), 那么 \(q_B(A)=q_B(SBS^{-1})=Sq_B(B)S^{-1}=0\), 所以 \(q_B(t)\) 是一個使 \(A\) 零化的首 1 多項式,從而 \(q_A(t)\) 的次數小於或等於 \(q_B(t)\) 的次數. 但是 \(B=S^{-1}AS\),所以相同的推理表明 \(q_{B}(t)\) 的次數小於或等於 \(q_A(t)\) 的次數. 從而 \(q_A(t)\) 與 \(q_B(t)\) 都是使 \(A\) 零化的最小次數的首 1 多項式,故而由定理 1 知它們是相等的.
需要注意的是,矩陣 \(A\) 與 \(B\) 有相同的極小多項式,不代表它們一定相似,比如 \(A=J_2(0) \oplus J_2(0) \in M_4\) 與 \(B=J_2(0) \oplus 0_2(0) \in M_4\).
推論 2: 對每一個 \(A \in M_n\), 極小多項式 \(q_A(t)\) 整除特征多項式 \(p_A(t)\). 此外,\(q_A(\lambda)=0\) 當且僅當 \(\lambda\) 是 \(A\) 的特征值,故而 \(p_A(t)=0\) 的每個根都是 \(q_A(t)\) 的根.
證明: 由於 \(p_A(A)=0\), 則存在一個多項式 \(h(t)\) 使得 \(p_A(t)=h(t)q_A(t)\). 這個分解式使得 \(q_A(t)=0\) 的每個根都是 \(p_A(t)=0\) 的你根這一事實變得顯然,從而 \(q_A(t)=0\) 的每個根都是 \(A\) 的特征值. 如果 \(\lambda\) 是 \(A\) 的一個特征值,又如果 \(x\) 是與之相伴的特征向量,那么 $Ax=\lambda x $, 且 \(0=q_A(A) x=q_A(\lambda) x\), 所以 \(q_A(\lambda)=0\).
上面這個推論表明,如果特征多項式 \(p_A(t)\) 被完全分解成
\begin{align} \label{e1}
p_A(t)=\prod_{j=1}^d(t-\lambda_i)^{s_i},\quad 1 \leqslant s_i \leqslant n, \quad s_1+s_2+\cdots+s_d =n
\end{align}
其中 \(\lambda_1,\lambda_2,\cdots,\lambda_d\) 各不相同,那么極小多項式 \(q_A(t)\) 必定有形式
\begin{align} \label{e2}
q_A(t)=\prod_{i=1}^d(t-\lambda_i)^{r_i}, 1\leqslant r_i \leqslant s_i
\end{align}
這就從理論上對尋求給定矩陣 \(A\) 的極小多項式給出一個算法:
1. 首先計算 \(A\) 的特征值,包括它們的重數,這或許通過求出特征多項式並將其完全分解即可得到. 用某種方法確定分解式 \ref{e1}.
2. 存在有限多個形如 \ref{e2} 的多項式. 從所有 \(r_i=1\) 的乘積出發,用顯示計算來確定使 \(A\) 零化的最小次數的乘積,這就是極小多項式.
從數值計算上來說,對於大矩陣計算過於復雜,但在處理簡單的小矩陣的徒手計算時還是非常有效的.
在 \(A\in M_n\) 的標准型與 \(A\) 的極小多項式之間存在密切的聯系. 假設 \(A=SJS^{-1}\) 是 \(A\) 的 Jordan 標准型,又首先假設 \(J=J_n(\lambda)\) 是單獨一個 Jordan 塊. \(A\) 的特征多項式是 \((t-\lambda)^n\), 由於當 \(k<n\) 時有 \((J-\lambda I)^k \neq 0\), 所以 \(J\) 的極小多項式仍然是 \((t-\lambda)^n\). 然而,如果 \(J=J_{n_1}(\lambda) \oplus J_{n_2}(\lambda) \in M_n\)(其中 \(n_1 \geqslant n_2\)), 則 \(J\) 的特征多項式仍然是 \((t-\lambda)^n\), 但現在有 \((J-\lambda I)^{n_1}=0\), 且沒有更低次的冪變為零. 這樣一來,\(J\) 的極小多項式是 \((t-\lambda)^{n_1}\). 如果對特征值 \(\lambda\) 有多個 Jordan 塊,則有相同結論:\(J\) 的極小多項式是 \((t-\lambda)^r\), 其中 \(r\) 是與 \(\lambda\) 對應的最大 Jordan 塊的階. 如果 \(J\) 是一般的 Jordan 矩陣,其極小多項式必定包含因子 \((t-\lambda_i)^{r_i}\)(對每一個不同的特征值 \(\lambda_i\));而 \(r_i\) 必定是與 \(\lambda_i\) 對應的最大 Jordan 塊的階;沒有更低的冪能零化與 \(\lambda_i\) 對應的所有 Jordan 塊,而且也不需要更高的冪. 由於相似矩陣有相同的極小多項式,我們就證明了下面的定理.
定理 2: 設 \(A \in M_n\) 是一個給定的矩陣,其不同的特征值是 \(\lambda_1\cdots \lambda_d\). 則 \(A\) 的極小多項式是
\begin{align} \label{e3}
q_A(t)=\prod_{i=1}^d(t-\lambda_i)^{r_i}
\end{align}
其中 \(r_i\) 是 \(A\) 的與特征值 \(\lambda_i\) 對應的最大 Jordan 塊的階.
實際上,這個結果在計算極小多項式時沒有太多的幫助,因為通常確定一個矩陣的 Jordan 標准型比確定它的極小多項式更為困難. 的確,如果僅僅知道矩陣的特征值,它的極小多項式就可以通過簡單的試錯法確定. 然而,這個結果有一些有重要理論價值的推論. 由於一個矩陣可對角化當且僅當它所有 Jordan 塊的階均為 1, 所以矩陣可對角化的一個充分必要條件就是式 \ref{e3} 中所有的 \(r_i=1\).
推論 3: 設 \(A \in M_n\) 有不同的特征值 \(\lambda_1\cdots \lambda_d\). 又令
\begin{align} \label{e4}
q(t)=(t-\lambda_1)(t-\lambda_2)\cdots (t-\lambda_d)
\end{align}
那么,\(A\) 可對角化當且僅當 \(q(A)=0\)
這個判別法對於判斷一個給定的矩陣是否可以對角化是有實際用途的,只要我們知道它不同的特征值:構造多項式 \ref{e4} 並觀察它是否使 \(A\) 零化. 如果它使 \(A\) 零化,它必定就是 \(A\) 的極小多項式,這是因為沒有更低次數的多項式能以 \(A\) 的所有不同特征值作為其零點了. 如果它不能使 \(A\) 零化,那么 \(A\) 不可對角化. 將此結果總結成若干等價的形式是有益的.
推論 4: 設 \(A \in M_n\), 而 \(q_A(t)\) 是它的極小多項式,則以下諸結論等價:
(a) \(q_A(t)\) 是不同線性因子的乘積
(b) \(A\) 的每一個特征值作為 \(q_A(t)=0\) 的根的重數都是 1
(c) 對 \(A\) 的每個特征值 \(\lambda\), 都有 \(q'_A(\lambda) \neq 0\)
(d) \(A\) 可以對角化
友矩陣
對給定的 \(A\in M_n\), 我們迄今正在考慮的是尋求使 \(A\) 零化的最小次數的首 1 多項式. 但是對於其逆,我們能說什么呢?給定一個首 1 多項式
\begin{align}\label{e5}
p(t)=t^n+a_{n-1}t^{n-1}+a_{n-2}t^{n-2}+\cdots+a_1t+a_0
\end{align}
是否存在一個矩陣 \(A\), 使得它以 \(p(t)\) 作為它的極小多項式呢?若如是,則 \(A\) 的大小必定至少是 \(n \times n\). 考慮
\begin{align} \label{e6}
A=\begin{bmatrix} 0 &&&& -a_0 \\ 1 & 0 &&& -a_1 \\ & 1 & \ddots && \vdots \\ && \ddots & 0 & -a_{n-2} \\ 0 &&& 1 & -a_{n-1}\end{bmatrix} \in M_n
\end{align}
並注意到
\begin{align}
& I e_1 &= \, &e_1 =\quad A^0e_1 \notag \\
& A e_1 &= \, &e_2 = \quad Ae_1 \notag\\
& A e_2 &= \, &e_3 = \quad A^2 e_1 \notag \\
& A e_3 &= \, &e_4 = \quad A^3 e_1 \notag \\
& \,\,\, \vdots & \notag \\
& A e_{n-1} &= \,& e_n = \quad A^{n-1}e_1 \notag
\end{align}
進一步有
\begin{align}
Ae_n &=-a_{n-1}e_n-a_{n-2}e_{n-1}-\cdots -a_1e_2-a_0e_1 \notag \\
&=-a_{n-1}A^{n-1}e_1-a_{n-2}A^{n-2}e_1 -\cdots -a_1Ae_1-a_0 e_1 \notag \\
&=(A^n-p(A))e_1
\end{align}
於是
\begin{align}
p(A)e_1 &=(a_0e_1+a_1Ae_1+a_2A^2e_1+\cdots +a_{n-1}A^{n-1}e_1)+A^ne_1 \notag \\
&=(p(A)-A^n)e_1+(A^n-p(A))e_1 \notag \\
&=0
\end{align}
此外,對每個 \(k=1,2,\cdots,n\) 有 \(p(A)e_k=p(A)A^{k-1}e_1=A^{k-1}p(A)e_1=A^{k-1}0=0\). 由於對每個基向量 \(e_k\) 有 \(p(A)e_k=0\), 我們斷定有 \(p(A)=0\). 從而 \(p(t)\) 是使 \(A\) 零化的 \(n\) 次首 1 多項式. 如果存在一個更低次數 \(m<n\) 且使 \(A\) 零化的多項式 \(q(t)=t^m+b_{m-1}t^{m-1}+\cdots+b_1t+b_0\), 那么
\begin{align}
0&=q(A)e_1=A^me_1+b_{m-1}A^{m-1}e_1+\cdots+b_1Ae_1+b_0e_1 \notag \\
&=e_{m+1}+b_{m-1}e_m+\cdots+b_1e_2+b_0e_1=0
\end{align}
而這是不可能的,因為 \(e_1,\cdots,e_{m+1}\) 是線性無關的. 我們斷言:\(n\) 次多項式 \(p(t)\) 是使 \(A\) 零化的最低次數的首 1 多項式,所以它就是 \(A\) 的極小多項式. 特征多項式 \(p_A(t)\) 也是一個使 \(A\) 零化的 \(n\) 次首 1 多項式,故而定理 1 確保 \(p(t)\) 也是矩陣 \ref{e6} 的特征多項式.
定義 2: 矩陣 \ref{e6} 稱為多項式 \ref{e5} 的友矩陣.
我們已經證明了下面的結論:
定理 3:每一個首 1 多項式既是它的友矩陣的極小多項式,又是它的友矩陣的特征多項式.
如果 \(A \in M_n\) 的極小多項式的次數為 \(n\),那么 \ref{e3} 中的指數滿足 \(r_1+\cdots+r_d=n\);也就是說,與每一個特征值對應的最大的 Jordan 塊就是與每一個特征值對應的唯一的 Jordan 塊. 這樣的矩陣是無損的. 特別地,每一個友矩陣都是無損的. 當然,不一定每個無損的矩陣 \(A\in M_n\) 都是友矩陣,但是 \(A\) 與 \(A\) 的特征多項式的友矩陣 \(C\) 有同樣的 Jordan 標准型(與每一個不同的特征值 \(\lambda_i\) 對應的只有一個分塊 \(J_{r_i}(\lambda_i)\)), 所以 \(A\) 與 \(C\) 相似.
定理 4:設 \(A \in M_n\) 有極小多項式 \(q_A(t)\) 以及特征多項式 \(p_A(t)\). 則下面諸結論等價:
(a) \(q_A(t)\) 的次數為 \(n\)
(b) \(p_A(t)=q_A(t)\)
(c) \(A\) 是無損的
(d) \(A\) 與 \(p_A(t)\) 的友矩陣相似
應該知道什么
- 極小多項式存在且唯一
- 相似矩陣具有相同的極小多項式,反之不成立
- 友矩陣是以事先給定多項式為極小多項式的矩陣
- 每一個首 1 多項式既是它的友矩陣的極小多項式,又是它的友矩陣的特征多項式