Schur 三角化定理的推論


將學習到什么

從 Schur 的酉三角化定理可以收獲一批結果,在這一部分介紹重要的幾個.

 


跡與行列式

相似矩陣具有相同的特征多項式, 從特征多項式一節中, 我們又知道,相似矩陣的跡以及行列式都是相同的,且分別用所有特征值的和與積表示,所以對於矩陣 \(A\in M_n\), \(\mathrm{tr}\,A\)\(\mathrm{det}\,A\) 都可以用任何與 \(A\) 相似矩陣來計算,酉三角化中的上三角矩陣 \(T\) 的主對角線元素就是矩陣 \(A\) 的特征值,所以計算非常方便。

 

\(A\) 的多項式的特征值

假設 \(A\in M_n\) 有特征值 \(\lambda_1,\cdots\,\lambda_n\), 並設 \(p(t)\) 是一個給定的多項式,從特征值的特征向量的定理 1.1 知:對每一個 \(i=1,\cdots,n\), \(p(\lambda_i)\) 都是 \(p(A)\) 的特征值,又如果 \(\mu\)\(p(A)\) 的特征值,那么就存在某個 \(i\in \{1,\cdots,n\}\), 使得 \(\mu=p(\lambda_i)\). 這些結論給出了 \(p(A)\) 的特征值,但沒有給出它們的重數,Schur 定理揭示出它們的重數.

\(A=UTU^*\), 其中 \(U\) 是酉矩陣,而 \(T=[t_{ij}]\) 是上三角矩陣,其主對角元素是 \(t_{11}=\lambda_1,t_{22}=\lambda_2,\cdots,t_{nn}=\lambda_n\). 這樣就有 \(p(A)=p(UTU^*)=Up(T)U^*\), \(p(T)\) 的主對角元素是 \(p(\lambda_1),p(\lambda_2),\cdots,p(\lambda_n)\), 故而由矩陣 \(T\) 的對角元素算出 \(p(T)\) 的特征值重數. 特別地,對每個 \(k=1,\cdots\), 矩陣 \(A^k\) 的特征值是 \(\lambda_1^k,\cdots,\lambda_n^k\), 且
\begin{align}
\mathrm{tr}\, A^k=\lambda_1^k+\cdots+\lambda_n^k
\end{align}
假設 \(A\in M_n\), 如果對某個正整數 \(k\)\(A^k=0\), 那么 \(\sigma(A)=\{0\}\), 所以 \(A\) 的特征多項式是 \(p_A(t)=t^n\), 其逆命題也成立,即如果 \(\sigma(A)=\{0\}\), 那么存在一個酉矩陣 \(U\) 以及一個嚴格上三角矩陣 \(T\), 使得 \(A=UTU^*\), 於是如下結論等價:\(A\) 是冪零的\(\Leftrightarrow A^n=0 \Leftrightarrow \sigma(A)=\{0\}\).

 

Cayley-Hamilton 定理

這個定理是說:\(p_A(t)\)\(A\) 的特征多項式,那么 \(p_A(A)=0\).
通過多項式分解和酉相似,利用歸納法可以證明. 這個定理常常被解釋成每個方陣都滿足它自己的特征方程,不過這需要仔細加以理解:純量多項式 \(p_A(t)\) 首先是作為 \(p_A(t)=\mathrm{det}\, (tI-A)\) 計算的,然后才是通過代換 \(t \rightarrow A\) 來計算矩陣 \(p_A(A)\).
Cayley-Hamilton 定理的一項重要用途是將 \(A\in M_n\) 的冪 \(A^k\) (對 \(k \geqslant n\))寫成 \(I,A,A^2,\cdots,A^{n-1}\) 的線性組合. 比如 \(A=\begin{bmatrix} 3 & 1 \\ -2 & 0 \end{bmatrix}\). 那么 \(p_A(t)=t^2-3t+2\), 所以 \(A^2-3A+2I=0\), 從而 \(A^2=3A-2I\),\(A^3=(3A-2I)A=3A^2-2A=3(3A-2I)-2A=7A-6I\), 類似可計算 \(A^4,A^5,\cdots\) 等等. 還可以將非奇異矩陣 \(A\) 的負次數冪表示成 \(A\)\(I\) 的線性組合,將 \(A^2-3A+2I=0\) 寫成 \(I=A\Big[ \dfrac 12 (-A+3I) \Big]\), 從而 \(A^{-1}=-\dfrac 12 A+\dfrac 32 I\),同樣可寫出 \(A^{-2},A^{-3}\) 等等.

 

關於線性矩陣方程的 Sylvester 定理

與交換性有關的方程 \(AX-XA=0\) 是線性矩陣方程 \(AX-XB=C\) 的一個特例,通常稱為Sylvester 方程.

這個定理不證明了,要了解定理中的那個充分必要條件.

 

Schur 三角化定理中的唯一性

對給定和 \(A \in M_n\)酉三角化 中定理 1.1 描述的那種可以通過酉相似得到的上三角型 \(T\) 不一定是唯一的. 也就是說,有相同主對角線的不同的上三角矩陣可能是酉相似的.
如果 \(T,T' \in M_n\) 是上三角的,且有相同的主對角線,主對角線上相同的元素歸並在一起,關於使得 \(T'=WTW^*\) (也就是 \(WT=T'W\))成立的酉矩陣 \(W \in M_n\), 有什么特點?下面的定理說的是:\(W\) 必定是分塊對角的,而且在關於 \(T\) 的超對角元素的某種假設之下,\(W\) 必定是對角矩陣,甚至是一個純量矩陣,在后一種情形有 \(T=T'\).

 

每一個方陣都可以分塊對角化

  **證明:** 將 $T$ 分划成 \\begin{align} T=\\begin{bmatrix} T\_{11} & Y \\\\ 0 & S\_2 \\end{bmatrix} \\notag \\end{align} 其中 $S_2=[T_{ij}]_{i,j=2}^d$. 注意 $T_{11}$ 的僅有的特征值是 $\lambda_1$, 而 $S_2$ 的特征值是 $\lambda_2,\cdots,\lambda_n$. Sylvester 定理保證了方程 $T_{11}X-XS=-Y$ 有一個解 $X$,用它來構造 \\begin{align} M=\\begin{bmatrix} I\_{n_1} & X \\\\ 0 & I \\end{bmatrix} \qquad \text{以及其逆} \qquad M^{-1}=\\begin{bmatrix} I\_{n_1} & -X \\\\ 0 & I \\end{bmatrix}\\notag \\end{align} 那么 \\begin{align} M^{-1}TM=\\begin{bmatrix} I\_{n_1} & -X \\\\ 0 & I \\end{bmatrix} \\begin{bmatrix} T\_{11} & Y \\\\ 0 & S\_2 \\end{bmatrix} \\begin{bmatrix} I\_{n_1} & X \\\\ 0 & I \\end{bmatrix}=\\begin{bmatrix} T\_{11} & T\_{11}X-XS_2+Y \\\\ 0 & S_2 \\end{bmatrix} = \\begin{bmatrix} T\_{11} & 0 \\\\ 0 & S\_2 \\end{bmatrix} \\notag \\end{align} 如果 $d=2$, 這就是所要的分塊對角化. 如果 $d>2$, 重復這一化簡過程來證明 $S_2$ 與 $T_{22}\oplus S_3$ 相似,其中 $S_3=[T_{ij}]_{i,j=3}^d$. 經過 $d-1$ 次化簡,我們就得知 $T$ 相似於 $T_{11}\oplus \cdots\oplus T_{dd}$. 如果 $A$ 是實的且有實特征值,那么它與一個剛剛考慮過的實的分塊上三角矩陣實正交相似,每一步的化簡都可以用實相似來實現.

 

秩 1 攝動的特征值

  **證明:** 設 $\xi = x/ \lVert x \rVert _2$, 並令 $U=[\xi \quad u_2 \quad \cdots \quad u_n]$ 是酉矩陣. 那么由 Schur 定理知 \\begin{align} U^\*AU=\\begin{bmatrix} \lambda & \bigstar \\\\ 0 & A_1 \\end{bmatrix} \\notag \\end{align} 其中 $A_1 \in M_{n-1}$ 有特征值 $\lambda_2,\cdots,\lambda_n$. 又有 \\begin{align} U^\*xv^\*U=\\begin{bmatrix} \xi^\*x \\\\ u_2^\*x \\\\ \vdots \\\\ u_n^\*x \\end{bmatrix} v^\* U = \\begin{bmatrix} \lVert x \rVert _2 \\\\0 \\\\ \vdots \\\\ 0 \\end{bmatrix} \\begin{bmatrix}v^\*\xi & v^\*u_2 & \cdots & v^\*u_n \\end{bmatrix}=\\begin{bmatrix} \lVert x \rVert _2 v^\*\xi & \bigstar \\\\ 0 & 0 \\end{bmatrix} = \\begin{bmatrix} v^\*x & \bigstar \\\\ 0 & 0 \\end{bmatrix} \\notag \\end{align} 這樣一來, \\begin{align} U^\*(A+xv^\*)U= \\begin{bmatrix}\lambda+ v^\*x & \bigstar \\\\ 0 & A_1 \\end{bmatrix} \\notag \\end{align} 就有特征值 $\lambda+v^*x,\lambda_2,\cdots,\lambda_n$.

 


應該知道什么

  • 酉三角化對於求矩陣的跡與行列式是方便的
  • \(A\) 的多項式的特征值可以通過酉相似容易辨別出來
  • 每個方陣都滿足它自己的特征方程
  • 每一個方陣都可以分塊對角化
  • 秩 1 攝動的特征值


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM