概要
主要介紹了特征多項式、代數重數、幾何重數以及重要的性質。
一個復方陣有多少個特征值?
首先要做的當然是給出定義啦!
接下來給出一個結論:
證明:我們分三步加以說明,
- 由 \(tI-A\) 行列式的計算展開表達式知,只有全取對角元素時,求和項次數才能達到 \(n\),即
\begin{align}
(t-a_{11}) \cdots (t-a_{nn}) = t^n-(a_{11}+ \cdots + a_{nn}) t^{n-1}+\cdots
\label{eq1}
\end{align}
任何其它因子必包含非對角因子 \(-a_{ij}\,(i \neq j)\),則對角元素 \(t-a_{ii}\) 與 \(t-a_{jj}\) 不可能也是因子。因此求和項次數不可能大於 \(n-2\),於是式 \ref{eq1} 確定了 \(t^n\) 和 \(t^{n-1}\) 的系數。\(p_A(t)\) 的常系數項正好是 \(p_A(0)=\mathrm{det}(-A)=(-1)^n \mathrm{det} A\) . - $p_A(\lambda)=0 \Leftrightarrow \mathrm{det}(\lambda I-A)=0 \Leftrightarrow (\lambda I-A)x=0, x\neq 0 \Leftrightarrow \lambda \in \sigma(A) $
- 一次數為 \(n\geqslant 1\) 的多項式至多有 \(n\) 個不同零點。
結論 \(1.1\) 告訴我們,結合推廣的韋達定理知:\(p_A(t)\) 的零點之和是 \(A\) 的跡 \(tr(A)\),而零點之積則是 \(A\) 的行列式 \(\mathrm{det} A\)。進一步, 如果 \(p_A(t)\) 的每個零點的重數都是 \(1\),\(tr(A)\) 是 \(A\) 的特征值之和,而 \(\mathrm{det} A\) 是 \(A\) 的特征值之積 . 其實條件 “ 如果 \(p_A(t)\) 的每個零點的重數都是 \(1\)” 可以不需要,只不過得按照它們作為特征方程的重數來對 \(A\) 的特征值加以計數,下面引入代數重數的概念,
我們約定 \(A \in M_n\) 的特征值總是指這個特征值與其相對應的(代數)重數的合並稱謂. 因此無需限制就能說:每個矩陣 \(A \in M_n\) 在復數中恰好有 \(n\) 個特征值,且 \(A\) 的跡和行列式分別是它的特征值之和以及乘積.
我們知道了每一個 \(n\times n\) 復矩陣都有有限多個特征值,故可以給出如下定義.
在本小節的最后,再給出一個重要的定理,
證明:在上一節 特征值和特征向量 的推論 \(1.2\) 知,\(\lambda \in \sigma(A) \Leftrightarrow \lambda + \varepsilon \in \sigma(A+\varepsilon I)\),我們的目標是 $ \lambda + \varepsilon \neq 0$, 如果 \(A\) 的所有特征值都為零,取 \(\delta=1\),如果 \(A\) 的某個特征值不為零,則令 \(\delta=\min \{\lvert \lambda \rvert: \lambda \in \sigma(A) , \lambda \neq 0\}\) , 此時任何一個滿足 \(0<\lvert \varepsilon \rvert<\delta\) 的 \(\varepsilon\), 必有 \(-\varepsilon \notin \sigma(A)\),所以 $ \lambda + \varepsilon \neq 0$, 即 \(0 \notin \sigma(A+\varepsilon I)\), 因此 \(A+\varepsilon I\) 是非奇異的.
上述定理表明,一個奇異的復矩陣總可以稍加平移使之成為非奇異的.
幾何重數
開始先給出一個關於特征值的結論,
證明:由於 \(\mathrm{det}(tI-A^T)=\mathrm{det}(tI-A)^T=\mathrm{det}(tI-A)\), 我們有 \(p_{A^T}(t)=p_A(t)\), 所以有 \(p_{A^T}(\lambda)=0\) 當且僅當 \(p_A(\lambda)=0\). 類似地,\(\mathrm{det}(\bar{t}I-A^*)=\mathrm{det}[(tI-A)^*]=\overline{\mathrm{det}(tI-A)}\), 所以 \(p_{A^*}(\bar{t})=\overline{p_A(t)}\), 又 \(p_{A^*} (\bar{\lambda})=0\) 當且僅當 \(p_A(\lambda)=0\).
如果 \(x,y\in \mathbb{C}^n\) 兩者都是 \(A\in M_n\) 的與特征值 \(\lambda\) 相伴的特征向量,那么 \(x\) 與 \(y\) 的任何非零的線性組合也是它的與 \(\lambda\) 相伴的特征向量 。實際上,與一個給定的 \(\lambda \in \sigma(A)\) 相伴的所有特征向量組成的集合與零向量合起來作成 \(\mathbb{C}^n\) 的一個子空間,該子空間就是 \(A-\lambda I\) 的零空間,就是齊次線性方程組 \((A-\lambda I)x=0\) 的解集,由秩的關系知其維數是 \(n-\mathrm{rank} (A-\lambda I)\). 該空間有個名字就是特征空間,下面給出特征空間的完整定義,
由 \(Ax=\lambda x\) 便知,\(A\) 的與特征值 \(\lambda\) 相伴的特征空間是一個 \(A\)-不變子空間,需要注意的是,一個 \(A\)-不變子空間不一定就是 \(A\) 的特征空間。特征向量不能為零,所以最小的 \(A\)-不變子空間(不包含有嚴格的更低維度的非零的 \(A\)-不變子空間) \(W\) 是 \(A\) 的單獨一個特征向量所生成的子空間,也就是說 \(\mathrm{dim} W=1\)。介紹完特征空間,就可以定義幾何重數了,
可以證明特征值的幾何重數小於或者等於它的代數重數的。下面給一個說明:設 \(\alpha\) 是特征多項式 \(p(t)\) 的一個代數重數為 \(k \geqslant 1\) 的零點,當且僅當可以將 \(p(t)\) 寫成形式
\[
p(t)=(t-\alpha)^k q(t)
\]
其中 \(q(t)\) 是一個滿足 \(q(\alpha) \neq 0\) 的多項式。對 p(t) 求導得:\(p'(t)=k(t-\alpha)^{k-1}q(t)+(t-\alpha)^kq'(t)\), 它表明 \(p'(\alpha)=0\) 當且僅當 \(k>1\). 如果 \(k \geqslant 2\), 那么 \(p''(t)=k(k-1)(t-\alpha)^{k-2}\cdot q(t)+\) 若干個多項式項,其中每一項都含有一個因子 \((t-\alpha)^m, m\geqslant k-1\), 所以 \(p''(\alpha)=0\) 當且僅當 \(k>2\). 重復這一計算表明,\(\alpha\) 是 \(p(t)\) 的 \(k\) 重零點,當且僅當 \(p(\alpha)=p'(\alpha)=\cdots=p^{k-1}(\alpha)=0\) 以及 \(p^k(\alpha) \neq 0\). 據此可以證明一個定理,
證明:如果 令 \(B=A-\lambda I\), 那么 \(0\) 就是 \(B\) 的一個重數為 \(k\) 的特征值,從而有 \(p_B^{(k)}(0) \neq 0\). 但是 \(p_B^{(k)}(0) =k! (-1)^{n-k}E_{n-k}(B)\), 其中 \(E_{n-k}(B)\) 表示 \(B\) 的 \(n-k\) 階主子式之和,故有 \(E_{n-k}(B) \neq 0\). 特別地,\(B=A-\lambda I\) 的某個 \(n-k\) 階主子式不為零,所以 $\mathrm{rank} (A-\lambda I) \geqslant n-k $. 如果 \(k=1\), \(A-\lambda I\) 是奇異的,故而 \(n>\mathrm{rank}(A-\lambda I) \geqslant n-1\), 這就意味着:如果特征值 \(\lambda\) 的代數重數為 \(1\), 那么 \(\mathrm{rank} (A-\lambda I) = n-1\).
上述定理即可證明特征值的幾何重數小於或者等於它的代數重數,同時還說明了代數重數為 \(1\),幾何重數必定為 \(1\). 需要注意的是並不是說代數重數為 \(1\) 時,代數重數才等於它的幾何重數,比如單位矩陣 \(I_2\), \(\lambda=1\)代數重數和幾何重數都為 \(2\), 因此它也是半單的。
一個矩陣可對角化,當且僅當它是無虧的;它有完全不同的特征值,當且僅當它是無損的且是無虧的。考慮以下矩陣的特征值 \(\lambda=1\), 矩陣 \(\begin{bmatrix} 1&0 \\ 0 &2 \end{bmatrix}\),代數重數等於它的幾何重數且都是 \(1\), 它是無虧的,單位矩陣 \(I_2\) 是無虧的且是有損的,矩陣 \(\begin{bmatrix} 1&1 \\ 0 &1 \end{bmatrix}\), 幾何重數是 \(1\), 代數重數是 \(2\),它是有虧的且是無損的。
盡管 \(A\) 與 \(A^T\) 有相同的特征值,它們與給定特征值相伴的特征空間有可能是不同的。比如,矩陣 \(A=\begin{bmatrix} 2&3 \\ 0 &4 \end{bmatrix}\), 那么 \(A\) 的與特征值 \(2\) 相伴的(一維)特征空間是由 \(\begin{bmatrix} 1 \\ 0 \end{bmatrix}\) 生成的,而 \(A^T\) 的與特征值 \(2\) 相伴的特征空間是由 \(\begin{bmatrix} 1& \\ & -3/2 \end{bmatrix}\) 生成的。
讀完應該知道點什么
- 每個矩陣 \(A \in M_n\) 在復數中恰好有 \(n\) 個特征值,且 \(A\) 的跡和行列式分別是它的特征值之和以及乘積
- 一個奇異的復矩陣總可以稍加平移使之成為非奇異的
- 特征值的幾何重數小於或者等於它的代數重數