將要學習
關於 Hermite 矩陣的特征值不等式. Weyl 定理 以及推論.
Weyl 定理
Hermann Weyl 的如下定理是大量不等式的基礎,這些不等式要么涉及兩個 Hermite 矩陣之和,要么與加邊的 Hermite 矩陣有關.
定理1(Weyl): 設 \(A,B \in M_n\) 是 Hermite 矩陣,又設 \(A,B\) 以及 \(A+B\) 各自的特征值分別是 \(\{\lambda_i(A)\}_{i=1}^n, \{\lambda_i(B)\}_{i=1}^n\) 以及 \(\{\lambda_i(A+B)\}_{i=1}^n\), 它們每一個都按照遞增次序排列. 那么,對每一個 \(i=1,\cdots,n\) 就有
\begin{align} \label{e1}
\lambda_i(A+B) \leqslant \lambda_{i+j}(A) + \lambda_{n-j} (B) , \quad j=0,1,\cdots, n-i
\end{align}
其中的等式對某一對 \(i,j\) 成立,當且僅當存在一個非零向量 \(x\),使得 \(Ax=\lambda_{i+j}(A)x\), \(Bx=\lambda_{n-j}(B)x\) 以及 \((A+B)x=\lambda_i(A+B)x\). 又對每一個 \(i=1,\cdots,n\) 有
\begin{align} \label{e2}
\lambda_{i-j+1}(A)+\lambda_j(B) \leqslant \lambda_i(A+B), \quad j=1,\cdots ,i
\end{align}
其中和等式對某一對 \(i,j\) 成立,當且僅當存在一個非零向量 \(x\),使得 \(Ax=\lambda_{i-j+1}(A)x\), \(Bx=\lambda_j(B)x\) 以及 \((A+B)x=\lambda_i(A+B)x\). 如果 \(B\) 沒有公共的特征向量,那么定理中的兩個不等式都是嚴格不等式.
證明: 設 \(x_1,\cdots,x_n\),\(y_1,\cdots,y_n\) 以及 \(z_1,\cdots,z_n\) 分別是 \(A\),\(B\) 以及 \(A+B\) 的標准正交的特征向量組,使得對每一個 \(i=1,\cdots,n\) 都有 \(Ax_i=\lambda_i(A)x_i\),\(By_i=\lambda_i(B)y_i\) 以及 \((A+B)z_i=\lambda_i(A+B)z_i\). 對給定的 \(i \in \{1,\cdots,n\}\) 以及任意的 \(j \in \{0,\cdots,n-i\}\), 設 \(S_1 =\mathrm{span} \{x_1,\cdots,x_{i+j}\}\),\(S_2 =\mathrm{span} \{y_1,\cdots,y_{n-j}\}\),\(S_3 =\mathrm{span} \{z_i,\cdots,z_n\}\). 那么
\begin{align}
\mathrm{dim}S_1 + \mathrm{dim}S_2 + \mathrm{dim}S_3 = (i+j) +(n-j) + (n-i+1) = 2n+1
\end{align}
所以有子空間的交引理知,存在一個單位向量 \(x \in S_1 \cap S_2 \cap S_3\). 借助Rayleigh 商定理三次就得到兩個不等式
\begin{align}
\lambda_i(A+B) \leqslant x^*(A+B)x = x^*Ax + x^*Bx \leqslant \lambda_{i+j}(A) + \lambda_{n-j}(B)
\end{align}
第一個不等式由 \(x \in S_3\) 得出,而第二個不等式則分別由 \(x \in S_1\) 以及 \(x \in S_3\) 得出. ( \ref{e1} ) 中關於等式成立情形的命題由 Rayleigh 商定理中單位向量 \(x\) 成立等式的情形以及下諸不等式推出:\(x^*Ax \leqslant \lambda_{i+j}(A)\),\(x \in S_1\);\(x^*Bx \leqslant \lambda_{n-j}(B)\),\(x \in S_2\) 以及 $ \lambda_i(A+B) \leqslant x^*(A+B)x\(,\)x \in S_3$.
不等式 (\ref{e2}) 以及它們的等式成立的情形可通過將 (\ref{e1}) 應用於 \(-A,-B\) 以及 \(-(A+B)\) 得出:
\begin{align}
-\lambda_{n-i+1}(A+B) =\lambda_i(-A-B) \leqslant \lambda_{i+j}(-A) + \lambda_{n-j}(-B) = -\lambda_{n-i-j+1}(A) -\lambda_{j+1}(B)
\end{align}
如果我們令 \(i'=n-i+1\) 以及 \(j'=j+1\), 則上一個不等式就變成
\begin{align}
\lambda_{i'}(A+B) \geqslant \lambda_{i'-j'+1}(A) + \lambda_{j'}(B), \quad j'=1,\cdots, i'
\end{align}
這就是 (\ref{e2}).
如果 \(A\) 與 \(B\) 沒有公共的特征向量,那么 (\ref{e1}) 和 (\ref{e2}) 中等式成立的必要條件就不可能滿足.
Weyl 定理描述了一個 Hermite 矩陣 \(A\) 的特征值如果受到另一個 Hermite 矩陣 \(B\) 加性的擾動可能會發生什么. 關於擾動矩陣 \(B\) 的各種不同的條件會導致出現 (\ref{e1}) 和 (\ref{e2}) 的各種特例的不等式.
重要推論
接下來講述的推論中,特征值仍是遞增排序. 下面給個小例子,以便引出推論. 設 \(B \in M_n\) 是 Hermite 矩陣. 如果 \(B\) 恰好有 \(\pi\) 個正的特征值,而且恰好有 \(\nu\) 個負特征值,則 \(\lambda_{n-\pi}(B) \leqslant 0\) 以及 \(\lambda_{\nu+1}(B) \geqslant 0\), 其中的等式當且僅當 \(n>\pi + \nu\), 也即當且僅當 \(B\) 是奇異矩陣時成立.
推論1: 設 \(A,B\in M_n\) 是 Hermite 矩陣. 如果 \(B\) 恰好有 \(\pi\) 個正的特征值,而且恰好有 \(\nu\) 個負的特征值,那么
\begin{align} \label{e11}
\lambda_i(A+B) \leqslant \lambda_{i+\pi}(A),\quad i=1,\cdots,n-\pi
\end{align}
其中等式對某個 \(i\) 成立,當且僅當 \(B\) 是奇異的且存在非零向量 \(x\), 使得 \(Ax=\lambda_{i+\pi}(A) x\),\(Bx=0\) 以及 \((A+B)x=\lambda _i(A+B)x\). 我們還有
\begin{align} \label{e12}
\lambda_{i-\nu}(A) \leqslant \lambda_i(A+B),\quad i=\nu +1,\cdots, n
\end{align}
其中等式對某個 \(i\) 成立,當且僅當 \(B\) 是奇異的且存在一個非零向量 \(x\), 使得 \(Ax=\lambda_{i-\nu}(A) x\),\(Bx=0\) 以及 \((A+B)x=\lambda _i(A+B)x\). 如果 (\ref{e11}) 中 \(B\) 是非奇異的或者式 (\ref{e12}) 中對 \(A\) 的每一個特征向量都有 \(Bx \neq 0\), 則上述兩個不等式都是嚴格不等式.
對上述推論,再舉個特例,設 \(B \in M_n\) 是 Hermite 矩陣. 如果 \(B\) 是奇異的,且 \(\mathrm{rank}\,B=r\),由於 \(B\) 是 Hermite 矩陣,則其可以酉對角化,所以 \(B\) 的非零特征值的個數肯定等於 \(r\), 則 \(\lambda_{n-r} (B) \leqslant 0\) 以及 \(\lambda_{r+1} \geqslant 0\)(在上個推論中令 \(A=0\) 也可得到同樣的結果.)
推論2: 設 \(A,B\in M_n\) 是 Hermite 矩陣. 假設 \(B\) 是奇異的,且 \(\mathrm{rank}\,B=r\),那么
\begin{align} \label{e13}
\lambda_i(A+B) \leqslant \lambda_{i+r}(A),\quad i=1,\cdots,n-r
\end{align}
其中等式對某個 \(i\) 成立,當且僅當 \(\lambda_{n-r}(B) = 0\),且存在一個非零向量 \(x\),使得 \(Ax=\lambda_{i+r}(A)x\),\(Bx=0\) 以及 \((A+B)x=\lambda_i(A+B)x\). 又有
\begin{align} \label{e14}
\lambda_{i-r}(A) \leqslant \lambda_i(A+B),\quad i=r+1,\cdots,n
\end{align}
其中等式對某個 \(i\) 成立,當且僅當 \(\lambda_{i+1}(B)=0\),且存在一個非零向量 \(x\),使得 \(Ax=\lambda_{i-r}(A)x\),\(Bx=0\) 以及 \((A+B)x=\lambda _i(A+B)x\). 如果 \(A\) 的每個特征向量 \(x\) 都有 \(Bx \neq 0\), 則上述兩個不等式都是嚴格不等式.
設 \(B \in M_n\) 是 Hermite 矩陣. 如果 \(B\) 恰有一個正的特征值且恰有一個負的特征值,則 \(\lambda_2(B) \geqslant 0\) 且 \(\lambda_{n-1}(B) \leqslant 0\),其中的等式當且僅當 \(n>2\) 時成立.
推論3: 設 \(A,B\in M_n\) 是 Hermite 矩陣. 假設 \(B\) 恰有一個正的特征值且恰有一個負的特征值,那么
\begin{align}
& \lambda_1(A+B) \leqslant \lambda_2(A) \notag \\ \label{e8}
& \lambda_{i-1}(A) \leqslant \lambda_i(A+B) \leqslant \lambda_{i+1}(A), \quad i=2,\cdots, n-1 \\
& \lambda_{n-1}(A) \leqslant \lambda_n(A+B) \notag
\end{align}
等式對 \(\pi =\nu =1\) 成立,例如, \(\lambda_i(A+B) = \lambda_{i+1}(A)\) 當且僅當 \(n>2\) 且存在一個非零向量 \(x\),使得 \(Ax=\lambda_{i+1}(A)x\),\(Bx=0\) 以及 \((A+B)x=\lambda_i(A+B)x\) 時成立. 如果 \(n=2\) 或者對 \(A\) 的每個特征向量 \(x\) 有 \(Bx \neq 0\),那么上述三個不等式都是嚴格的不等式.
假設 \(z \in \mathbb{C}^n\) 是非零的且 \(n \geqslant 2\). 則 \(zz^*\) 的秩為 \(1\) 且只有一個正的特征值,所以 \(\lambda_{n-1}(zz^*)=0=\lambda_1(zz^*)\).
下面的推論稱為關於 Hermite 矩陣的秩 \(1\)-Hermite 攝動的交錯定理.
推論4:設 \(n \geqslant 2\),\(A \in M_n\) 是 Hermite 矩陣,又設 \(z \in \mathbb{C}^n\) 是非零向量. 那么
\begin{align}
& \lambda_i(A) \leqslant \lambda_i(A+zz^*) \leqslant \lambda_{i+1}(A),\quad i=1,\cdots,n-1 \\
& \lambda_n(A) \leqslant \lambda_n (A+zz^*) \notag
\end{align}
上式中的等式對 \(\pi=1\) 以及 \(\nu =0\) 成立,例如,\(\lambda_i(A+zz^*) = \lambda_{i+1}(A)\) 當且僅當存在一個非零向量 \(x\),使得 \(Ax=\lambda_{i+1}(A)x\),\(z^*x=0\) 以及 \((A+zz^*)x=\lambda_i(A+zz^*)x\). 又有
\begin{align}
& \lambda_1(A-zz^*) \leqslant \lambda_1(A) \\
& \lambda_{i-1}(A) \leqslant \lambda_i (A-zz^*) \leqslant \lambda_i(A),\quad i=2,\cdots,n \notag
\end{align}
上式中的等式對 \(\pi=0\) 以及 \(\nu =1\) 成立. 如果 \(A\) 沒有特征向量與 \(z\) 正交,那么上邊每一個不等式都是嚴格的不等式.
設 \(B \in M_n\) 是半正定的,則 \(\lambda_1(B)=0\) 當且僅當 \(B\) 是奇異的.
下面的推論稱為單調定理.
推論5:設 \(A,B \in M_n\) 是 Hermite 矩陣,並假設 \(B\) 是半正定的. 那么
\begin{align}
\lambda_i(A) \leqslant \lambda_i(A+B),\quad i=1,\cdots,n
\end{align}
其中等式對某個 \(i\) 成立,當且僅當 \(B\) 是奇異的,且存在一個非零向量 \(x\),使得 \(Ax=\lambda_i(A)x\),\(Bx=0\) 以及 \((A+B)x=\lambda_i(A+B)x\). 又如果 \(B\) 是正定的,那么
\begin{align}
\lambda_i(A) < \lambda_i(A+B),\quad i=1,\cdots,n
\end{align}
設給定 \(y \in \mathbb{C}^n\) 以及 \(a \in \mathbb{R}\),又設 \(\mathcal{K} = \begin{bmatrix} 0_n & y \\ y^* & a \end{bmatrix} \in M_{n+1}\). 由加邊矩陣的行列式的 Cauchy 展開式 \(\mathrm{det} \begin{bmatrix} A & x \\ y^T & a \end{bmatrix} =a\,\mathrm{det} \,A -y^T(\mathrm{adj}\,A)x\) 得:\(\mathcal{K}\) 的特征值是 \((a \pm \sqrt{a^2+4y^*y})/2\) 再加上 \(n-1\) 個為零的特征值. 如果 \(y \neq 0\),推出結論:\(\mathcal{K}\) 恰好有一個正的特征值,也恰好有一個負的特征值.
Weyl 不等式以及它們的推論考慮的是 Hermite 矩陣的加性 Hermite 攝動. 從 Hermite 矩陣中取出一個主子矩陣,或者通過對它加邊作成一個更大的 Hermite 矩陣,都會出現加性的特征值不等式. 下面的結果是關於加邊的 Hermite 矩陣的 Cauchy 交錯定理,有時它也稱為分離定理.
定理2(Cauchy): 設 \(B \in M_n\) 是 Hermite 矩陣,設給定 \(y \in \mathbb{C}^n\) 以及 \(a \in \mathbb{R}\),又設 \(A = \begin{bmatrix} B & y \\ y^* & a \end{bmatrix} \in M_{n+1}\). 那么
\begin{align} \label{e18}
\lambda_1(A) \leqslant \lambda_1(B) \leqslant \lambda_2(A) \leqslant \cdots \leqslant \lambda_n(A) \leqslant \lambda_n(B) \leqslant \lambda_{n+1}(A)
\end{align}
其中 \(\lambda_i(A)=\lambda_i(B)\) 成立的充分必要條件是:存在一個非零的 \(z \in \mathbb{C}^n\),使得 \(Bz=\lambda_i(B)z\),\(y^*z=0\),以及 \(Bz=\lambda_i(A)z\);\(\lambda_i(B)=\lambda_{i+1}(A)\) 成立的充分必要條件是:存在一個非零的 \(z \in \mathbb{C}^n\),使得 \(Bz=\lambda_i(B)z\),\(y^*z=0\),以及 \(Bz=\lambda_{i+1}(A)z\). 如果 \(B\) 沒有與 \(y\) 正交的特征向量,則上式中的每一個不等式都是嚴格不等式.
證明: 如果我們用 \(A+\mu I_{n+1}\) 代替 \(A\)(這就用 \(B+\mu I\) 代替了 \(B\)),那么結論中有序排列中的特征值的交錯性不變. 於是,不失一般性,可以假設 \(B\) 與 \(A\) 是正定的. 考慮 Hermite 矩陣 $\mathcal{H} =\begin{bmatrix} B & 0 \\ 0 & 0_1 \end{bmatrix} $ 以及 $\mathcal{K}= \begin{bmatrix} 0_n & y \\ y^* & a \end{bmatrix} $,對它們有 \(A=\mathcal{H}+\mathcal{K}\). \(\mathcal{H}=B\oplus [0]\) 的有序排列的特征值是 \(\lambda_1(\mathcal{H})=0 < \lambda_1(B)=\lambda_2(\mathcal{H}) \leqslant \lambda_2(B) = \lambda_3(\mathcal{H}) \leqslant \cdots\),即對所有 \(i=1,\cdots,n\) 都有 \(\lambda_{i+1}(\mathcal{H}) = \lambda_i(B)\). 由於 $\mathcal{K} $ 恰好有一個正的特征值和一個負的特征值,故而不等式 (\ref{e8}) 確保
\begin{align} \label{e19}
\lambda_i(A) = \lambda_{i}(\mathcal{H} + \mathcal{K}) \leqslant \lambda_{i+1}(\mathcal{H}) = \lambda_i(B), \quad i=1,\cdots,n
\end{align}
對一個給定的 \(i\),(\ref{e19}) 中等式成立的必要與充分條件表述在推論 3 中:存在一個非零的 \(x \in \mathbb{C}^{n+1}\),使得 \(\mathcal{H}x = \lambda_{i+1}(\mathcal{H})x\),\(\mathcal{K}x=0\),\(Ax=\lambda_i(A)x\). 如果我們用 \(z \in \mathbb{C}^n\) 來分划 $x= \begin{bmatrix} z \\ \xi \end{bmatrix} $ 並利用恆等式 \(\lambda_{i+1}(\mathcal{H}) = \lambda_i(B)\),計算揭示這些條件對於以下結論是等價的:存在一個非零的 \(z \in \mathbb{C}^n\),使得 \(Bz=\lambda_i(B)z\),\(y^*z=0\),以及 \(Bz=\lambda_i(A)z\). 特別地,如果 \(B\) 沒有與 \(y\) 正交的特征向量,那么就不存在 \(i\),使得必要條件 \(z \neq 0\),\(Bz=\lambda_i(B)z\) 以及 \(y^*z=0\) 能得到滿足.
對 \(i=1,\cdots,n\),不等式 \(\lambda_i(B) \leqslant \lambda_{i+1}(A)\) 可以通過將 (\ref{e19}) 應用於 \(-A\) 得到:
\begin{align} \label{e20}
-\lambda_{(n+1)-i+1}(A) = \lambda_i(-A) \leqslant \lambda_i(-B) = -\lambda_{n-i+1}(B)
\end{align}
如果置 \(i'=n-i+1\),我們就對 \(i'=1,\cdots,n\) 得到等價的不等式 \(\lambda_{i'+1}(A) \geqslant \lambda_{i'}(B)\). (\ref{e20}) 中等式出現的情形再次由推論 3 得出.
我們已經討論了特征值交錯定理的兩個例子:如果一個給定的 Hermite 矩陣或者通過增加一個秩 1 的 Hermite 矩陣或者通過加邊來加以修改,那么新舊特征值必定是交錯的. 下面不加證明的給出這些定理的逆.
定理3: 設 \(\lambda_1,\cdots, \lambda_n\) 以及 \(\mu_1,\cdots, \mu_n\) 是滿足交錯不等式
\begin{align}
\lambda_1 \leqslant \mu_1 \leqslant \lambda_2 \leqslant \mu_2 \leqslant \cdots \leqslant \lambda_n \leqslant \mu_n
\end{align}
的實數. 設 \(\Lambda= \mathrm{diag} \{\lambda_1,\cdots, \lambda_n\}\). 那么存在一個實向量 \(z \in \mathbb{R}^n\), 使得 \(\Lambda+zz^*\) 的特征值是 \(\mu_1,\cdots,\mu_n\).
應該知道什么
- Weyl 定理:$\lambda_i(A+B) \leqslant \lambda_{i+j}(A) + \lambda_{n-j} (B) $ 與 \(\lambda_{i-j+1}(A)+\lambda_j(B) \leqslant \lambda_i(A+B)\)
- Hermite 矩陣非零特征值的個數等於其秩的大小
- 假設 \(z \in \mathbb{C}^n\) 是非零的且 \(n \geqslant 2\). 則 \(zz^*\) 的秩為 \(1\) 且只有一個正的特征值
- 如果一個給定的 Hermite 矩陣或者通過增加一個秩 1 的 Hermite 矩陣或者通過加邊來加以修改,那么新舊特征值必定是交錯的.