線性代數應該這樣學9：上三角矩陣、對角矩陣

本文轉載自查看原文 2021-02-16 19:30 823

在本系列中，我的個人見解將使用斜體標注。由於時間關系，移除了例題部分，可參考答案鏈接，如有疑問，可在評論區處留言。由於文章是我獨自整理的，缺乏審閱，難免出現錯誤，如有發現歡迎在評論區中指正。

Part 1：上三角矩陣
Part 2：對角矩陣

Part 1：上三角矩陣

本節含有許多實用性的結果，並且證明手段往往不唯一，應當認真體會一下不同證明方法之間的異同。

本征值的存在性 有限維非零復向量空間上，每個算子均有本征值。

注意，這里並沒有涉及本征值的個數，也不涉及重特征值問題。

設\(\dim V=n>0\)，\(T\in\mathcal L(V)\)。取\(v\in V\)且\(v\ne 0\)，\(n+1\)個向量\(v,Tv,\cdots,T^nv\)線性相關，故存在不全為0的實數\(a_0,a_1,\cdots,a_n\)，使得

\[0=a_0v+a_1Tv+\cdots+a_nT^nv. \]

如果\(a_1=\cdots=a_n=0\)，則由於\(v\ne 0\)必有\(a_0=0\)，這與線性相關矛盾。令

\[p(z)=a_0+a_1z+\cdots+a_nz^n, \]

由上面的分析，它不是一個常值多項式，故存在\(\lambda_1,\cdots,\lambda_m\in\mathbb{C}\)，使得

\[p(z)=a_0+a_1z+\cdots+a_nz^n=c(z-\lambda_1)\cdots(z-\lambda_m) \]

所以

\[0=p(T)v=c(T-\lambda_1I)\cdots(T-\lambda_mI)v \]

至少存在一個\(j\)，使得\(T-\lambda_jI\)不可逆（否則容易得出\(v=0\)），故找到了\(T\)的一個本征值\(\lambda_j\)。

習題16、17分別利用線性映射證明本征值的存在性，下面給出證明。

對於\(T\in\mathcal L(V)\)，構造線性映射\(f\in\mathcal L(\mathcal P_n(\mathbb{C}),V)\)，其中\(\forall p\in\mathcal P_n(\mathbb{C})\)，有

\[f(p)=p(T)v\in V. \]

由於\(\dim\mathcal P_n(\mathbb{C})=n+1>n=\dim V\)，所以\(f\)不是單射，存在\(p\ne 0\)使得

\[p(T)v=0. \]

顯然\(p(z)\)不能是非零常數，由代數基本定理，可以分解為

\[c(T-\lambda_1I)\cdots(T-\lambda_mI)=0, \]

所以存在一個\(\lambda_j\)是\(T\)的特征值。

對於\(T\in\mathcal L(V)\)，構造線性映射\(g\in\mathcal L(P_{n^2}(\mathbb{C}),\mathcal L(V))\)，其中\(\forall p\in\mathcal P_{n^2}(\mathbb{C})\)，有

\[g(p)=p(T), \]

由於\(\dim\mathcal P_{n^2}(C)=n^2+1>n^2=\dim\mathcal L(V)\)，所以\(g\)不是單射，存在\(p\ne 0\)使得

\[p(T)=0 \]

顯然\(p(z)\)不能使非零常數，故依舊有如上的分解。

算子的矩陣(matrix of an operator) 設\(T\in\mathcal L(V)\)，並設\(v_1,\cdots,v_n\)是\(V\)的基，\(T\)關於該基的矩陣定義為\(\mathcal M(T)=(A_{i,k})_{n\times n}\)，其元素定義為

\[Tv_k=A_{1,k}v_1+\cdots+A_{n,k}v_k. \]

在討論線性映射的矩陣時，為\(V,W\)都找了一組基；而進入到算子的矩陣，由於線性空間只有一個，所以只使用\(V\)的一組基，並且一般使用標准基。

矩陣的對角線(diagonal of a matrix) 方陣的對角線由位於左上角到右下角的直線上的元素組成。

上三角矩陣(upper-triangular matrix) 如果位於方陣對角線下方的元素都是0，則這個方陣稱為上三角矩陣。

上三角矩陣與不變子空間之間存在聯系，若\(T\in\mathcal L(V)\)，且\(v_1,\cdots,v_n\)是\(V\)的基，則以下三個說法等價：

\(T\)關於\(v_1,\cdots,v_n\)的矩陣\(\mathcal M(T)\)是上三角的。
\(\forall j=1,\cdots,n\)，\(Tv_j\in\mathrm{span}(v_1,\cdots,v_j)\)。
\(\forall j=1,\cdots,n\)，\(\mathrm{span}(v_1,\cdots,v_j)\)是\(T\)下的不變子空間。

上三角矩陣的存在性 在\(V(\mathbb{C})\)上，每個算子\(T\in\mathcal L(V)\)均有上三角矩陣。

這個定理的實用之處在於，將特征值關聯到了線性映射上。並且，書上給出的兩個證明，一個基於限制算子，一個基於商算子，由於商算子我們平時不常用，因此更應該注意商算子的用法。

限制算子：使用數學歸納法，若\(\dim V=1\)，則結論顯然成立。

現設\(\dim V>1\)，且對於所有維數比\(V\)小的復向量空間都成立這樣的結論。設\(\lambda\)是\(T\)的任意本征值，\(U=\mathrm{range}(T-\lambda I)\)，則由於\(T-\lambda I\)不是滿射，有\(\dim U<\dim V\)。下證明\(U\)是\(T\)下的不變子空間，\(\forall u\in U\)，有

\[Tu=(T-\lambda I+\lambda I)u=(T-\lambda I)u+\lambda u\in U. \]

故\(T|_U\)是\(U\)上的算子，由歸納假設，\(U\)有基\(u_1,\cdots,u_m\)使得\(T|_U\)關於這個基有上三角矩陣，因此對每個\(j=1,\cdots,m\)都有

\[Tu_j=T|_U (u_j)\in\mathrm{span}(u_1,\cdots,u_j). \]

將\(u_1,\cdots,u_m\)擴充成\(V\)的基\(u_1,\cdots,u_m,v_1,\cdots,v_n\)，對每個\(k\)，都有

\[Tv_k=(T-\lambda I)v_k+\lambda v_k, \]

由於\((T-\lambda I)v_k\in U\)，\(\lambda v_k\in\mathrm{span}(v_k)\subset\mathrm{span}(v_1,\cdots,v_k)\)，所以

\[Tv_k\in\mathrm{span}(u_1,\cdots,u_m,v_1,\cdots,v_k), \]

故\(T\)關於基\(u_1,\cdots,u_m,v_1,\cdots,v_n\)有上三角矩陣。

商算子：使用數學歸納法，若\(\dim V=1\)，則結論顯然成立。

現設\(\dim V=n>1\)，並設對於所有\(n-1\)維復向量空間都成立這樣的結論。設\(v_1\)是\(T\)的任意一個本征向量，\(U=\mathrm{span}(v_1)\)，則\(U\)是\(T\)下的不變子空間，且\(\dim U=1\)，故\(\dim V/U=n-1\)。

對\(V/U\)，由歸納假設，存在一組基\(v_2+U,\cdots,v_n+U\)，使得\(T/U\)關於該基有上三角矩陣，即\(\forall j=2,\cdots,v_n\)有

\[(T/U)(v_j+U)\in\mathrm{span}(v_2+U,\cdots,v_j+U), \]

即

\[Tv_j+U=a_2v_2+\cdots+a_jv_j+U, \]

所以

\[Tv_j-(a_2v_2+\cdots+a_jv_j)=a_1v_1, \]

故

\[Tv_j\in\mathrm{span}(v_1,\cdots,v_j). \]

這就證明\(T\)關於\(v_1,\cdots,v_n\)這組基（這一組確實是基）存在上三角矩陣。

上三角矩陣與可逆性 若\(T\in\mathcal L(V)\)關於\(V\)的某個基有上三角矩陣，則\(T\)是可逆的當且僅當這個上三角矩陣對角線上的元素都不是0。

這是一個基礎定理，由此可以很容易得到其他推論。

設\(v_1,\cdots,v_n\)是\(V\)的基，\(T\)關於這組基存在上三角矩陣：

\[\mathcal M(T)=\begin{pmatrix} \lambda_1 & & & * \\ \vdots & \lambda _2 & & \\ 0 & 0 & \ddots & \\ 0 & 0 & \cdots & \lambda_n \end{pmatrix}. \]

先證充分性。上面的矩陣表明\(Tv_1=\lambda_1v_1\)，由於\(\lambda_1\ne 0\)，所以\(T(v_1/\lambda_1)=v_1\)，即\(v_1\in\mathrm{range}T\)。從而

\[T(v_2/\lambda_2)=a_1v_1+v_2,\quad v_2\in\mathrm{range}T,\\ T(v_3/\lambda_3)=b_1v_1+b_2v_2+v_3,\quad v_3\in\mathrm{range}T,\\ \vdots \]

以此類推，\(v_1,\cdots,v_n\in\mathrm{range}T\)，故\(T\)是滿的，等價於\(T\)是可逆的。

再證必要性。\(T\)是可逆的故\(\mathrm{null}T=\{0\}\)，所以\(Tv_1=\lambda_1v_1\ne 0\)，\(\lambda_1\ne 0\)。如果存在某個\(\lambda_j=0\)，且\(\forall k<j\)都有\(\lambda_k\ne 0\)，則

\[Tv_j\in\mathrm{span}(v_1,\cdots,v_{j-1}), \]

同時\(T\)將\(\mathrm{span}(v_1,\cdots,v_{j})\)映射到\(\mathrm{span}(v_1,\cdots,v_{j-1})\)上，即\(T\)在子空間\(\mathrm{span}(v_1,\cdots,v_{j-1})\)上不是單射，存在某個\(v\in\mathrm{span}(v_1,\cdots,v_j)\)使得\(v\ne 0\)且\(Tv=0\)，這與\(T\)的可逆性矛盾。

上三角矩陣的特征值 設\(T\in\mathcal L(V)\)關於\(V\)的某個基有上三角矩陣，則\(T\)的本征值恰為這個上三角矩陣對角線上的元素。

設\(\lambda \in\mathbb{F}\)，則

\[\mathcal M(T-\lambda I)=\begin{pmatrix} \lambda_1-\lambda & & & * \\ \vdots & \lambda _2-\lambda & & \\ 0 & 0 & \ddots & \\ 0 & 0 & \cdots & \lambda_n-\lambda \end{pmatrix}. \]

為使得\(T-\lambda I\)可逆，必有\(\lambda\)等於\(\lambda_1,\cdots,\lambda_n\)中的某一個，即\(\lambda_1,\cdots,\lambda_n\)是\(T\)的全部特征值。

Part 2：對角矩陣

對角矩陣(diagonal matrix) 對角矩陣是對角線以外的元素全是0的方陣。

若一個算子關於某個基有對角矩陣，則對角線上的元素恰為該算子的本征值。

本征空間(eigenspace) 設\(T\in\mathcal L(V)\)且\(\lambda \in \mathbb{F}\)，則\(T\)相應於\(\lambda\)的本征空間定義為

\[E(\lambda,T)=\mathrm{null}(T-\lambda I). \]

如果\(\lambda\)不是\(T\)的本征值，則\(E(\lambda,T)=\{0\}\)，反之亦然。
\(E(\lambda,T)\)是\(T\)的相對應於\(\lambda\)的全體本征向量加上\(0\)構成的集合。
\(E(\lambda,T)\)是\(V\)關於\(T\)的不變子空間，\(\forall v\in E(\lambda,T)\)，\(Tv=\lambda v\)。

本征空間的和是直和 設\(V\)是有限維的，\(T\in\mathcal L(V)\)，且\(\lambda_1\cdots,\lambda_m\)是\(T\)的互異本征值，則

\[E(\lambda_1,T)+\cdots+E(\lambda_m,T) \]

是直和，且

\[\dim E(\lambda_1,T)+\cdots+\dim E(\lambda_m,T)\le \dim V. \]

這說明，不同本征空間是互不相交的（除了\(0\)）。這里用的是小於等於號，說明\(V\)中並非所有向量都是特征向量。

假設\(u_j\in E(\lambda_j,T)\)，且\(u_1+\cdots+u_m=0\)。由於相應於不同本征值的本征向量線性無關，所以\(u_j=0,\forall j\)，這說明

\[E(\lambda_1,T)+\cdots+E(\lambda_m,T) \]

是直和，自然成立下方的不等式。

可對角化(diagonalizable) 如果算子\(T\)關於\(V\)的某個基有對角矩陣，則\(T\)是可對角化的。

可對角化的算子具有很簡潔的表達形式，如果要計算\(Tv\)，只要將\(v\)關於對角基分解即可。

以下說法等價：

\(T\)可對角化。
\(V\)有由\(T\)的本征向量構成的基。
\(V\)有在\(T\)下不變的一維子空間\(U_1,\cdots,U_n\)，使得\(V=U_1\oplus\cdots\oplus U_n\)。
\(V=E(\lambda_1,T)\oplus\cdots\oplus E(\lambda_m,T)\)。
\(\dim V=\dim E(\lambda_1,T)+\cdots+\dim E(\lambda_m,T)\)。

以上五點，\(1\Leftrightarrow 2\Leftrightarrow 3\)和\(4\Leftrightarrow 5\)都是顯然的，下證\(2\Leftrightarrow 4\)。

先證\(2\Rightarrow 4\)，若\(V\)有\(T\)的本征向量構成的基，則顯然

\[V=E(\lambda_1,T)+\cdots+E(\lambda_m,T). \]

又因為不同本征值對應的本征空間是直和，所以

\[V=E(\lambda_1,T)\oplus\cdots\oplus E(\lambda_m,T). \]

最后證\(4\Rightarrow 2\)，在每個\(E(\lambda_j,T)\)內取一組基，將其合在一起就得到\(V\)的本征向量構成的基。

本征值足夠多則可對角化 若\(T\in\mathcal L(V)\)有\(\dim V\)個互異的本征值，則\(T\)可對角化。

設\(\dim V=n\)，\(\lambda_1,\cdots,\lambda_n\)是\(T\)的\(n\)個互異本征值，對應的本征向量為\(v_j\)，則這些\(v_j\)是線性無關的，由於長度為\(n\)的線性無關組是\(V\)的基，所以\(v_1,\cdots,v_j\)是\(V\)的一組基，故\(T\)可對角化。

事實上，由於不同本征空間都是\(T\)下的不變子空間，所以將不同本征空間的基組成整個\(V\)上的一組線性無關向量，對應的矩陣是一個對角子矩陣；進而將這個向量組擴充成一組基。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 線性代數筆記23——矩陣的對角化和方冪線性代數：矩陣線性代數之矩陣代數線性代數-正定矩陣線性代數之——復數矩陣線性代數應該這樣學4：線性映射，單射與滿射，零空間與像空間，線性映射基本定理線性代數應該這樣學2：子空間、有限維向量空間、線性無關線性代數之——矩陣乘法和逆矩陣線性代數-矩陣的初等變換線性代數——矩陣的初等變換