現在就來研究將空間分割為不變子空間的方法,最困難的是我們還不知道從哪里着手。你可能想到從循環子空間出發,一塊一塊地進行分割,但這個方案的存在性和唯一性都不能解決。不變子空間分割不僅要求每個子空間\(V'\)是不變的,還隱含要求\(V'\)之外元素的像不落在\(V'\)中,這一條就導致從局部開始分割的方案是行不通的。另外,這種方法也無法保障分割的唯一性,因為分割過程依賴每個子空間的選取。
1. 化零多項式
看來還是得從全局出發,期望找到某個屬性,它能將空間完美分割。那么首先要將整個空間\(V\)放置在\(\mathscr{A}\)的某個屬性下,然后按這個屬性再進行細分。這一步該如何跨出是很艱難的,想必歷史上也並不是一蹴而就得來的。前面我們已經做了一些簡單的鋪墊,最重要的一個是,變換的多項式所具有的不變子空間。你可能問過自己,對一般的變換,是否有對其成立的恆等式?如果可以在多項式中找到這個等式就更好了。
想法是很好的,但在走向結論時卻需要一個巧妙的構造,我不知道數學家們是如何得到的,畢竟自己的素養還不夠。回顧特征矩陣\(\lambda I-A\),你既可以把它看成是矩陣系數的多項式,也可以看成是以多項式為元素的矩陣。但在所有的變形中,其實我們默認\(\lambda\)是域\(K\)中的元素,而不是任意的不定元。所以變形得到的等式也不能草率地當作一般多項式看待,尤其不能隨便用一個矩陣帶入到式子中,這一點一定要弄清楚。
但慶幸的是,還真有一個特殊情況,矩陣是可以代入多項式等式的。考察特征矩陣的任意一個等式(1),展開左式並對應到右式,得到一系列等式(2)。等式兩邊分別乘上\(I,A,A^2,\cdots\)並相加,就得到\(0=f(A)\),這就仿佛是將矩陣\(A\)代入了等式(1)。但這種代入一般是很難成立,它是得益於特征矩陣的特殊形式,我們可以把這個有趣的性質當做結論,
\[(\lambda I-A)g(\lambda)=(\lambda I-A)(\lambda^mB_m+\lambda^{m-1}B_{m-1}+\cdots+B_0)=\lambda^nC_n+\lambda^{n-1}C_{n-1}+\cdots+C_0=f(\lambda)\tag{1}\]
\[-AB_0=C_0;\;B_0-AB_1=C_1;\;B_1-AB_2=C_2;\cdots B_{n-1}-AB_n=C_n;\;B_n-AB_{n+1}=0;\cdots B_m=0\tag{2}\]
特別地,取\(g(\lambda)\)為\(\lambda I-A\)的伴隨矩陣,等式右邊就是\(\varphi(\lambda)I\),從而有Hamilton-Caylay定理成立(公式(3),請參考抽象代數多項式里的余數定理)。定理的線性變換形式是\(\varphi(\mathscr{A})=0\),這個公式對整個空間\(V\)都成立,或者說\(V\)是變換\(\varphi(\mathscr{A})\)的核,我們就從這里開始尋找進一步的結論。
\[\varphi(\lambda)=|\lambda I-A|\quad\Rightarrow\quad \varphi(A)=0\tag{3}\]
更一般地,滿足\(f(\mathscr{A})=0\)的多項式稱為\(\mathscr{A}\)的化零多項式,其中次數最小的首一多項式叫做\(\mathscr{A}\)的最小多項式,記作\(d(\lambda)\)。這些定義對矩陣同樣成立,而且顯然最小多項式也是相似變換的不變量。類似抽象代數中的分析,容易知道最小多項式是唯一的,且它整除所有的化零多項式,從而有\(d(\lambda)\mid \varphi(\lambda)\)。
特征多項式和最小多項式還有一個有趣的應用,先給它們一個統一的形式\(f(\lambda)=\lambda^n+a_{n-1}\lambda^{n-1}+\cdots+a_0\),則\(f(A)=0\)。對可逆矩陣\(A\),易知\(a_0\ne 0\),將\(a_0I\)移到等式右邊,左邊提取出\(A\)便有等式(4)成立。根據這個等式可以比較容易地計算\(A^{-1}\)。
\[A(A^{n-1}+a^{n-1}A^{n-2}+\cdots+a_1I)=a_0I\tag{4}\]
• 求證:循環子空間的特征多項式即最小多項式,並求上一篇中式(18)的特征多項式。
2. 根子空間
更一般地,我們考察任何多項式\(f(\lambda)\),設它有互質分解\(f(\lambda)=f_1(\lambda)f_2(\lambda)\),即有式(5)成立。考察不變子空間\(W=\text{Ker}\,f(\mathscr{A})\)和\(W_i=\text{Ker}\,f_i(\mathscr{A})\),首先顯然有\(W_i\subseteq W\)。對任何\(\alpha\in W\),有\(f_1(\mathscr{A})f_2(\mathscr{A})(\alpha)=0\),再由公式(5)知\(\alpha\)可按式(6)進行分解,但顯然\(\alpha_i\in W_i\),所以有\(W=W_1+W_2\)。
\[g_1(\lambda)f_1(\lambda)+g_2(\lambda)f_2(\lambda)=1\tag{5}\]
\[\alpha=g_1(\mathscr{A})f_1(\mathscr{A})(\alpha)+g_2(\mathscr{A})f_2(\mathscr{A})(\alpha)=\alpha_2+\alpha_1\tag{6}\]
現在設\(\beta\in W_1\cap W_2\),再次用公式(5)有\(\beta=g_1(\mathscr{A})f_1(\mathscr{A})(\beta)+g_2(\mathscr{A})f_2(\mathscr{A})(\beta)=0\),從而\(W_1\cap W_2=0\),這就是說\(W=W_1\oplus W_2\)。以此歸納,如果\(f(\lambda)\)有互質分解\(f_1(\lambda)f_2(\lambda)\cdots f_s(\lambda)\),則有公式(7)成立。
\[\text{Ker}\,f(\mathscr{A})=\text{Ker}\,f_1(\mathscr{A})\oplus\text{Ker}\,f_2(\mathscr{A})\oplus\cdots\oplus\text{Ker}\,f_s(\mathscr{A})\tag{7}\]
現在來看最小多項式\(d(\lambda)\),在代數閉域(復數域)中有互質分解(8),將公式(7)應用到式(8)便有式(9)成立。其中\(W_i\)都是不變子空間,這就找到了我們所要的分割。雖然這個分割保證了存在性和唯一性,但還沒有達到最小分割,相似矩陣也沒有找到簡單的標准型,這個任務到下一段再解決。
\[d(\lambda)=(\lambda-\lambda_1)^{r_1}(\lambda-\lambda_2)^{r_2}\cdots(\lambda-\lambda_s)^{r_s}\tag{8}\]
\[V=W_{\lambda_1}\oplus W_{\lambda_2}\oplus\cdots\oplus W_{\lambda_s},\quad W_{\lambda_i}=\text{Ker}\,(\mathscr{A}-\lambda_i\mathscr{I})^{r_i}\tag{9}\]
有些細節我們還需要再討論一下,最小多項式和特征多項式有什么關系?最小究竟是什么最小?特征多項式根的重數又代表什么?首先易知\(W_{\lambda_i}\)都不為零,否則\(d(\lambda)\)去掉\((\lambda-\lambda_i)^{r_i}\)后仍然是化零多項式,這與最小多項式矛盾。\(W_{\lambda_i}\)非零等價於說\(A-\lambda_i I\)不是滿秩的,從而\(\lambda_i\)是\(A\)的特征值。反之根據公式(9)知,\(\lambda_1,\cdots,\lambda_s\)包含了所有\(A\)的特征值,否則直和包含不了所有的特征子空間。從而最小多項式與特征多項式有完全一樣的根,且由整除性知,特征多項式根的重數不小於最小多項式根的重數(公式(10))。
\[\varphi(\lambda)=(\lambda-\lambda_1)^{t_1}(\lambda-\lambda_2)^{t_2}\cdots(\lambda-\lambda_s)^{t_s},\quad t_i\geqslant r_i>0\tag{10}\]
現在設\(U_k=\text{Ker}\,(\mathscr{A}-\lambda_i\mathscr{I})^k\),顯然\(U_1\)就是\(\lambda_i\)的特征子空間,並且有\(U_1\subseteq U_2\subseteq U_3\subseteq\cdots\)。這個序列不會無窮遞增,且容易證明等式一旦\(U_m=U_{m+1}\)成立,等式會一直成立。如果\(m>r_i\),則\(U_m\supset W_{\lambda_i}\)且\(U_m\)與其它\(W_{\lambda}\)無交集,這與公式(9)矛盾。如果\(m<r_i\),則\(U_m=W_{\lambda_i}\),帶入公式(9)容易證明,將\(d(\lambda)\)中的\((\lambda-\lambda_i)^{r_i}\)換成\((\lambda-\lambda_i)^m\)后仍然是化零多項式,這與最小多項式矛盾。
從而正好有\(m=r_i\),這就找到了最小多項式根的重數的意義(公式(11)),為此也稱\(W_{\lambda_i}\)為\(\lambda_i\)的根子空間。把\(W_{\lambda_i}\)簡記為\(W\),顯然線性變換\(\mathscr{A}\)在\(W\)下的限制\(\mathscr{A}|_W\)也是線性變換,且由定義知該限制的最小多項式是\((\lambda-\lambda_i)^{r_i}\)。由公式和(9)和(10)的結論知,\(\mathscr{A}|_W\)的特征多項式正是\((\lambda-\lambda_i)^{t_i}\),從而間接說明了\(W_{\lambda_i}\)的維數是\(t_i\),這就是特征多項式根的重數的意義(公式(12))。
\[\text{Ker}\,(\mathscr{A}-\lambda_i\mathscr{I})\subset\cdots\subset\text{Ker}\,(\mathscr{A}-\lambda_i\mathscr{I})^{r_i}=\text{Ker}\,(\mathscr{A}-\lambda_i\mathscr{I})^{r_i+1}=\cdots\tag{11}\]
\[\dim\,W_{\lambda_i}=t_i\tag{12}\]
3. 冪零變換
由\(W\)的定義可知,\(r_i\)是使得\((\mathscr{A}-\lambda_i\mathscr{I})^k|_W=0\)的最小整數\(k\)。為此我們定義滿足\(\mathscr{A}^r=0,\mathscr{A}^{r-1}\ne 0\)的線性變換為\(r\)次冪零變換,從而\(\mathscr{A}-\lambda_i\mathscr{I}|_W\)是\(r_i\)次冪零變換。如果能找到冪零變換的簡單相似矩陣\(S\),則就可以有\(A\)的簡單相似矩陣\(S+\lambda_i I\),下面來着手解決這個問題。
冪零變換在任何子集的限制下仍然是冪零的,故任何不變子空間的最小多項式都是\(\lambda^m=0\)的形式。特別地,\(m\)階循環子空間的特征多項式和最小多項式都是\(\lambda^m=0\),這樣的循環子空間也叫強循環子空間。容易知道,強循環子空間的變換矩陣為式(13),而且它的\(k\)次冪正好是將\(I_n\)的對角線向右上角移動\(k\)次,故有\(\text{rank}\,J_n^k=n-k\),直至\(J_n^n=0\)。
\[J_n=\begin{bmatrix}0&1&&\\&\ddots&\ddots&\\&&\ddots&1\\&&&0\end{bmatrix}\tag{13}\]
設\(\mathscr{A}\)是\(n\)維空間\(V\)上的\(m\)次冪零變換,當\(n=1\)時顯然有\(\mathscr{A}=0\),結論比較平凡。當\(n=2\)時,\(m\)可以取\(1\)或\(2\),\(m=1\)時為平凡變換\(\mathscr{A}=0\)。\(m=2\)時存在\(\alpha\)使得\(\mathscr{A}\alpha\ne 0\),且\(\alpha,\mathscr{A}\alpha\)線性無關,所以\(V\)其實是一個\(2\)維強循環子空間。反過來再看\(m=1\)的情況,\(V\)其實就是兩個\(1\)維強循環子空間的直和。總結就有:\(n\)維空間在冪零變換下可以分解為\(l\)個強循環子空間的直和,其中\(l\)是\(\text{Ker}\,\mathscr{A}\)的維數。
設以上結論對\(k<n\)維空間成立,下面用歸納法來證結論對\(n\)維空間也成立。先記\(W=\text{Ker}\,\mathscr{A}\),對\(\mathscr{A}=0\)的平凡場景結論明顯成立,當\(\mathscr{A}\ne 0\)時\(W\ne 0\)且維度\(s<n\)。首先容易證明,\(V/W\)在\(\mathscr{A}\)上的誘導變換也是冪零變換,由歸納假設,它有如式(14)的直和分解。且由上一篇的結論我們知道,陪集的代表元和\(W\)的基正好是\(V\)一組完整的基,故有式(15)成立。
\[\left<\mathscr{A}^{s_1-1}\alpha_1+W,\cdots,\alpha_1+W\right>\oplus\cdots\oplus\left<\mathscr{A}^{s_t-1}\alpha_t+W,\cdots,\alpha_t+W\right>\tag{14}\]
\[V=W\oplus U,\quad U=\left<\mathscr{A}^{s_1-1}\alpha_1,\cdots,\alpha_1,\cdots,\mathscr{A}^{s_t-1}\alpha_t,\cdots,\alpha_t\right>\tag{15}\]
由於式(14)中每個子集在誘導映射下都是強循環子空間,故有\(\mathscr{A}^{s_i}\alpha_i\in W\)。考察它們的相關性,設\(k_1\mathscr{A}^{s_1}\alpha_1+\cdots+k_t\mathscr{A}^{s_t}\alpha_t=0\),即有式(16)成立,故\(\beta\in W\),而顯然\(\beta\in U\)。由式(15)知\(\beta=0\),所以\(k_i=0\),\(\mathscr{A}^{s_i}\alpha_i\)線性無關。
\[\mathscr{A}\beta=0,\quad \beta=k_1\mathscr{A}^{s_1-1}\alpha_1+\cdots+k_t\mathscr{A}^{s_t-1}\alpha_t\tag{16}\]
將\(\mathscr{A}^{s_i}\alpha_i\)擴展為\(W\)的一組基\(\mathscr{A}^{s_1}\alpha_1,\cdots,\mathscr{A}^{s_t}\alpha_t,\gamma_1,\cdots,\gamma_r\),考慮到\(\left<\mathscr{A}^{s_i}\alpha_i,\cdots,\alpha_i\right>\)和\(\left<\gamma_j\right>\)都是強循環子空間,故\(V\)可以分解為如式(17)強循環子空間的直和。更一般地描述為公式(18)(19),其中每個強循環子空間的階數\(s_i+1\)不大於冪零變換的次數\(m\)。
\[V=\left<\mathscr{A}^{s_1}\alpha_1,\cdots,\alpha_1\right>\oplus\cdots\oplus\left<\mathscr{A}^{s_t}\alpha_t,\cdots,\alpha_t\right>\oplus\left<\gamma_1\right>\oplus\cdots\oplus\left<\gamma_r\right>\tag{17}\]
\[V=\left<\mathscr{A}^{s_1}\alpha_1,\cdots,\alpha_1\right>\oplus\cdots\oplus\left<\mathscr{A}^{s_l}\alpha_l,\cdots,\alpha_l\right>\tag{18}\]
\[l= \dim{(\text{Ker}\,\mathscr{A})}=n-\text{rank}\,\mathscr{A}\tag{19}\]
進一步,根據\(J_n\)的特點,我們其實還可以具體求得\(k(1\leqslant k\leqslant m)\)階循環子空間的個數\(N(k)\)。首先顯然有公式(20)的系列等式成立,通過簡單的計算可以得到公式(21),這個公式說明了冪零矩陣分解得到的循環子空間的個數和次數都是確定的,也可以說這種分解是唯一的。
\[\text{rank}\,\mathscr{A}^0=N(1)\cdot 1+N(2)\cdot 2+\cdots+N(m)\cdot m\\\text{rank}\,\mathscr{A}^1=N(2)\cdot 1+N(3)\cdot 2+\cdots+N(m)\cdot (m-1)\\\text{rank}\,\mathscr{A}^2=N(3)\cdot 1+N(4)\cdot 2+\cdots+N(m)\cdot (m-2)\\\cdots\quad\cdots\tag{20}\]
\[N(k)=\text{rank}\,\mathscr{A}^{k-1}+\text{rank}\,\mathscr{A}^k-2\,\text{rank}\,\mathscr{A}^{k+1}\tag{21}\]
4. Jordan標准型及其計算
4.1 Jordan標准型
現在回到線性空間\(V\)在一般線性變換\(\mathscr{A}\)下的分解,前面已經知道,它可以按照特征值分解為幾個根子空間\(W_{\lambda_i}\),而根子空間在變換\(\mathscr{A}-\lambda_i\mathscr{I}\)下又是冪零變換。冪零變換的分解上面也徹底解決,結合這兩種分解容易知道,線性變換\(\mathscr{A}\)的矩陣相似於如下矩陣。其中對角線都是特征值,每個特征值的個數正是它的代數重數,去掉對角線后就是對應冪零變換的分解。
\[A\sim \begin{bmatrix}J_{n_{11}}(\lambda_1)&&&&&&\\&\ddots&&&&&\\&&J_{n_{1k_1}}(\lambda_1)&&&&\\&&&\ddots&&&\\&&&&J_{n_{s1}}(\lambda_s)&&\\&&&&&\ddots&\\&&&&&&J_{n_{sk_s}}(\lambda_s)\end{bmatrix},\quad J_n(\lambda)=\begin{bmatrix}\lambda&1&&\\&\ddots&\ddots&\\&&\ddots&1\\&&&\lambda\end{bmatrix}_{n\times n}\tag{21}\]
這個矩陣稱為Jordan標准型,其中每一個矩陣塊\(J_n(\lambda)\)也叫Jordan塊。不過要注意,我們討論根子空間的完全分解時,是在代數閉域(復數域)中進行的,所以只能說任何矩陣在代數閉域中相似於一個Jordan標准型。但其實對具體的矩陣,這個條件可以弱化為:域是變換的特征多項式的正規擴域(在域中可完全分解)。
4.2 \(\lambda\)-矩陣和初等因子
那么具體如何求Jordan標准型呢?只需先求得所有特征值,再利用公式(21)求每個Jordan塊的階數,具體過程就不贅述了。這個方法的計算復雜度較高,我們需要研究別的方法。通過結論我們已經知道,Jordan標准型由特征值和每個Jordan塊的階數\(n_{ik_j}\)完全決定,這些參數就是矩陣相似意義下的全系不變量。為了求得標准型,需要設計一個全系不變量,它包含了所有這些參數。
現在能想到的最接近的量就是特征多項式(10)了,它包含了所有特征值和每個特征值的代數重數,要想得到更完整的參數,我們不妨把目光放到特征多項式的源頭上:特征矩陣\(\lambda I-A\)。為此先討論更一般的、以域\(F\)上的多項式\(f(\lambda)\)為元素的矩陣\(A(\lambda)\),並稱之為\(\lambda\)-矩陣。這樣的矩陣同樣可以定義它的秩和逆矩陣,只不過逆矩陣只有在其行列式為常數時才存在。
\(\lambda\)-矩陣同樣可以進行初等變換並定義初等矩陣:\(P(i,j),P(i,j(f(\lambda))),P(i(k))\),但要注意,為了使初等變換可逆,每一行(列)只允許乘以非零常數\(k\in F\)。在抽象代數中我們知道,域上多項式環是一個歐式環,其上可以定義最大公約數(首項系數為\(1\)),還可以進行輾轉相除法。設\(A(\lambda)\)非零元素的最大公約數為\(d_1(\lambda)\),可以證明初等變換能把\(A(\lambda)\)轉換成\(\begin{bmatrix}d_1(\lambda)&0\\0&A_1(\lambda)\end{bmatrix}\),其中\(A_1(\lambda)\)的元素都是\(d_1(\lambda)\)的倍數。繼續這個過程可以將\(A(\lambda)\)轉換為如下Smith標准型,其中\(r\)顯然為\(A(\lambda)\)的秩。
\[\begin{bmatrix}d_1(\lambda)&&&\\&\ddots&&\\&&d_r(\lambda)&\\&&&0\end{bmatrix},\quad d_i(\lambda)\mid d_{i+1}(\lambda)\tag{22}\]
類似於一般矩陣,我們將可以通過初等變換互相轉換的\(\lambda\)-矩陣稱為相抵的,所以任何\(\lambda\)-矩陣都相抵於式(22)中的矩陣。另外顯然可逆\(\lambda\)-矩陣相抵於單位矩陣,也就是說可逆\(\lambda\)-矩陣可以分解為一系列初等矩陣相乘,這樣\(A(\lambda)\)和\(B(\lambda)\)相抵其實等價於:存在可逆\(\lambda\)-矩陣\(P(\lambda),Q(\lambda)\),使得公式(23)成立。
\[B(\lambda)=P(\lambda)A(\lambda)Q(\lambda)\tag{23}\]
對於一般矩陣的相抵,秩\(r\)完全確定了一個等價類,它是相抵矩陣的全系不變量。由於初等變換不改變元素的最大公約數,故式(22)中的\(d_i(\lambda)\)其實是確定的,它們也是相抵\(\lambda\)-矩陣的全系不變量,被稱為\(\lambda\)-矩陣的不變因子。現在回到特征矩陣\(A(\lambda)=\lambda I-A_n\),並設\(A\)的元素在代數閉域\(F\)中,由於其行列式\(\varphi(\lambda)\)非零,所以\(A(\lambda)\)是滿秩的。由於相抵\(\lambda\)-矩陣的行列式不變,故有式(24)成立。
\[\varphi(\lambda)=d_1(\lambda)d_2(\lambda)\cdots d_n(\lambda),\quad d_i(\lambda)=(\lambda-\lambda_1)^{e_{i1}}\cdots (\lambda-\lambda_s)^{e_{is}}\tag{24}\]
首先顯然有(25)左式成立(\(t_i\)為\(\lambda_i\)的代數重數),再由\(d_i(\lambda)\mid d_{i+1}(\lambda)\)可知還有(25)右式成立。由於\(d_i(\lambda)\)是全系不變量,故所有\((\lambda-\lambda_j)^{e_{ij}}\)其實是完全確定的,其中不為\(1\)那些項被稱為特征矩陣的初等因子。顯然所有初等因子組成的集合也是特征矩陣的全系不變量,被稱為初等因子組。
\[t_i=e_{1i}+e_{2i}+\cdots+e_{ni},\quad e_{1i}\leqslant e_{2i}\leqslant\cdots\leqslant e_{ni}\tag{25}\]
4.3 相似與相抵
現在你可能眼前一亮,初等因子和Jordan塊有什么關系?它們是不是一一對應的?我們費這么大勁討論初等因子,當然是有目的的。正如你所料,它們之間存在着對應關系,我們需要兩個結論來得到這樣的關系。
先來看看Jordan標准型的初等因子是什么,討論中只需進行簡單的初等變換即可,過程就不細說了。第一步要證明Jordan塊\(J_n(\lambda_0)\)的初等因子只有\((\lambda-\lambda_0)^n\),第二步證明分塊對角矩陣\(\begin{bmatrix}A&\\&B\end{bmatrix}\)的初等因子是\(A,B\)初等因子之並,第三步就推導出Jordan標准型(23)的初等因子正是所有Jordan塊的初等因子。
這樣一來,要求矩陣\(A\)的Jordan標准型\(J\),只需求\(J\)的初等因子。但我們手上只有\(A\),並且知道它與\(J\)相似,你自然想問,\(\lambda I -A\)和\(\lambda I -J\)的初等因子有什么關系呢?更一般地,設\(A\sim B\),即存在可逆矩陣\(P\),使得\(A=PBP^{-1}\)。那么有\(\lambda I-A=\lambda I-PBP^{-1}=P(\lambda I-B)P^{-1}\),從而\(\lambda I-A\)和\(\lambda I-B\)相抵。這就說明了相似矩陣的特征矩陣是相抵的,對應的初等因子也相同。以上結論就將求解矩陣\(A\)的Jordan標准型的問題,轉化成了求\(\lambda I -A\)初等因子的問題。
其實反過來,如果\(\lambda I-A\)和\(\lambda I-B\)相抵,它們的初等因子相同,從而\(A,B\)的Jordan標准型相同,這就有\(A\sim B\)。所以矩陣相似和特征矩陣相抵是等價的,初等因子是相似或相抵的全系不變量。這里再介紹一個證明必要性的方法,它對任何數域都成立,證明的步驟還可以用來求過渡矩陣。設存在可逆\(\lambda\)-矩陣\(P(\lambda),Q(\lambda)\),使得\(\lambda I-A=P(\lambda)(\lambda I-B)Q(\lambda)\),即\((\lambda I-A)Q^{-1}(\lambda)=P(\lambda)(\lambda I-B)=\lambda P(\lambda)-P(\lambda)B\)。根據公式(1)的結論將\(A\)帶入等式得到式(26),這也證明了\(A\sim B\),且過渡矩陣為\(P(\lambda)\)。
\[A=P(A)\,B\,P^{-1}(A)\tag{26}\]
• 求證:復方陣\(A\)相似於它的轉置\(A'\),並求過渡矩陣;
• 利用Jordan標准型求復方陣的最小多項式。
5. 實方陣的標准型
相對來說,實方陣其實更常用,雖然它不一定能有Jordan標准型,但我們還是可以得到一些有用的結論。當然實方陣只是復方陣的一個特例,充分利用復方陣的已有結論會簡化很多討論。先來看兩個在復數域上相似的實方陣\(A,B\),則存在實方陣\(P,Q\)使得下式成立左邊,化簡得到\(AP=PB,AQ=QB\),並進而有右邊成立。
\[A=(P+iQ)\,B\,(P+iQ)^{-1}\quad\Leftrightarrow\quad A(P+\lambda Q)=(P+\lambda Q)B\tag{27}\]
設\(\varphi(\lambda)=|P+\lambda Q|\),因為\(\varphi(i)\ne 0\),故\(\varphi(\lambda)\)非零。從而必定有實數\(\lambda_0\)使得\(\varphi(\lambda_0)\ne 0\),這時\(P+\lambda_0Q\)可逆,從而有式(28)成立。這就說明了\(A,B\)是實相似的,反之如果\(A,B\)實相似,它們當然復相似,所以實方陣的實相似和復相似是等價的。這個結論告訴我們,想要討論式方陣的“標准”實相似方陣,其實只需要找到與Jordan標准型復相似的“標准”實方陣。
\[A=(P+\lambda_0Q)\,B\,(P+\lambda_0Q)^{-1}\tag{28}\]
我們知道實系數多項式在實數域的因式最多為二次,從而實方陣的特征矩陣在實數域上的初等因子為\((\lambda-\lambda_0)^n\)或者為\((\lambda^2+a\lambda+b)^n\)。對於后者,它在復數域中表現為成對出現的初等因子\((\lambda-\lambda_0)^n,(\lambda-\bar{\lambda}_0)^n\)。為了把這樣的初等因子再合並成實數域上的\((\lambda^2+a\lambda+b)^n\),我們自然考慮將\((\lambda-\lambda_0)^n,(\lambda-\bar{\lambda}_0)^n\)的Jordan塊進行合並,也就是求與\(A=\begin{bmatrix}J_n(\lambda_0)&\\&J_n(\bar{\lambda}_0)\end{bmatrix}\)相似的實方陣。
如式(29)所示,其實Jordan塊還有另一個結構比較好的相似矩陣,這個矩陣使得初等變換很方便。它使得對\(A\)相似矩陣的討論,等價於對\(B=\begin{bmatrix}\lambda_0M&\\&\bar{\lambda}_0M\end{bmatrix}\)相似矩陣的討論。
\[\begin{bmatrix}1&&&\\&\lambda^{-1}&&\\&&\ddots&\\&&&\lambda^{-(n-1)}\end{bmatrix}\begin{bmatrix}\lambda&1&&\\&\ddots&\ddots&\\&&\ddots&1\\&&&\lambda\end{bmatrix}\begin{bmatrix}1&&&\\&\lambda&&\\&&\ddots&\\&&&\lambda^{(n-1)}\end{bmatrix}=\lambda\begin{bmatrix}1&1&&\\&\ddots&\ddots&\\&&\ddots&1\\&&&1\end{bmatrix}=\lambda M_n\tag{29}\]
設\(\lambda_0=\rho(\cos\theta+i\sin\theta)\),\(B\)的初等因子為\(\lambda^2-2\rho\cos\theta\lambda+\rho^2=(\lambda-\rho\cos\theta)^2+(\rho\sin\theta)^2\),容易構造出它也是\(C=\begin{bmatrix}\rho\cos\theta&\rho\sin\theta\\-\rho\sin\theta&\rho\cos\theta\end{bmatrix}\)的初等因子。這樣就有\(B\sim C\),進而我們就得到了與\(A\)相似的實方陣(30),最終也就得到實方陣的標准型。
\[\begin{bmatrix}J_n(\lambda_0)&\\&J_n(\bar{\lambda}_0)\end{bmatrix}\sim\rho\begin{bmatrix}\cos\theta M_n&\sin\theta M_n\\-\sin\theta M_n&\cos\theta M_n\end{bmatrix}\tag{30}\]