么正矩陣(酉矩陣)



本文的閱讀等級:中級

一實(或復) 正交矩陣(orthogonal matrix) Q 是一個實(或復) 方陣滿足

Q^TQ=QQ^T=I

Q^{-1}=Q^T 寫出 n\times n 階實正交矩陣的行向量(column vector) 表達, Q=\begin{bmatrix}  \mathbf{q}_1&\cdots&\mathbf{q}_n  \end{bmatrix} ,則 (Q^TQ)_{ij}=\mathbf{q}_i^T\mathbf{q}_j=(I)_{ij} ,矩陣乘積 Q^TQ (i,j) 元等於 \mathbf{q}_i \mathbf{q}_j 的內積。 因此, \mathbf{q}_i^T\mathbf{q}_j=\delta_{ij}=0 i\neq j \mathbf{q}_i^T\mathbf{q}_j=\delta_{ij}=1 i=j 換句話說,實正交矩陣 Q 的行向量 \{\mathbf{q}_1,\ldots,\mathbf{q}_n\} 是向量空間 \mathbb{R}^n 的一組單范正交基底(orthonormal basis),單范表示歸一, \mathbf{q}_i 是單位向量,正交意味 \mathbf{q}_i 垂直 \mathbf{q}_j 不過,復正交矩陣的行向量並非 \mathbb{C}^n 的一個單范正交集,因為兩個復向量 \mathbf{x} \mathbf{y} 的內積定義為 \mathbf{x}^\ast\mathbf{y}=\overline{\mathbf{x}}^T\mathbf{y} (見“ 內積的定義 ”)。 如欲將實正交矩陣推廣至復矩陣,將轉置改為共軛轉置。 一么正矩陣(酉矩陣,unitary matrix) U 是一個復方陣滿足

U^\ast U=UU^\ast=I

U^{-1}=U^\ast 同樣地,設 U=\begin{bmatrix}  \mathbf{u}_1&\cdots&\mathbf{u}_n  \end{bmatrix} ,則 (U^\ast U)_{ij}=\mathbf{u}_i^\ast\mathbf{u}_j=(I)_{ij} 么正矩陣的行向量 \{\mathbf{u}_1,\ldots,\mathbf{u}_n\} 是向量空間 \mathbb{C}^n 的一組單范正交基底。 例如,

U=\begin{bmatrix}  \displaystyle\frac{1+i}{2}&\displaystyle\frac{1+i}{2}\\[0.8em]    \displaystyle\frac{1-i}{2}&\displaystyle\frac{-1+i}{2}    \end{bmatrix}

其中 i=\sqrt{-1} 因為 (U^\ast)^\ast=U ,若 U 是一么正矩陣,則 U^\ast 也是么正矩陣。 所以,么正矩陣 U 的共軛列向量(row vector) 構成 \mathbb{C}^n 的一個單范正交集(事實上, U 的列向量即構成單范正交集,因為 \overline{U}^\ast\,\overline{U}=\overline{U}\,\overline{U}^\ast=I \overline{U} 也是么正矩陣)。 類似地,實正交矩陣 Q 的列向量構成 \mathbb{R}^n 的一個單范正交集。 在一般情況下,么正矩陣與復正交矩陣是不同的,但實么正矩陣與實正交矩陣是相同的。 所以,么正矩陣的所有性質皆可套用於實正交矩陣。


么正矩陣出現於許多矩陣分解式,舉兩個例子。 第一是矩陣三角化的Schur 定理:任一方陣 A 可分解為 A=UTU^\ast ,其中 U 是一么正矩陣, T 是上三角矩陣(見“ 矩陣三角化的Schur定理 ”)。 第二是正規矩陣(normal matrix) 的么正對角化(unitarily diagonalizable):若 A 為一正規矩陣, A^\ast A=AA^\ast ,則存在一么正矩陣 U 使得 A=U\Lambda U^\ast ,其中 \Lambda 為一對角矩陣(見“ 特殊矩陣(2):正規矩陣 ”)。 事實上,可么正對角化是正規矩陣的一個充要條件。

 


以下令 U 為一 n\times n 階么正矩陣,所有的性質都是由定義式得來。


性質1 .向量的長度不因么正變換而改變,即每一 \mathbf{x}\in\mathbb{C}^n

\Vert U\mathbf{x}\Vert=\Vert\mathbf{x}\Vert

性質1說明么正變換是一個保長((length-preserving) 變換。使用定義式,

\Vert U\mathbf{x}\Vert^2=(U\mathbf{x})^{\ast}(U\mathbf{x})=\mathbf{x}^{\ast}U^{\ast}U\mathbf{x}=\mathbf{x}^{\ast}I\mathbf{x}=\mathbf{x}^\ast\mathbf{x}=\Vert\mathbf{x}\Vert^2

反過來說,若所有向量 \mathbf{x}\in\mathbb{C}^n 都滿足 \Vert U\mathbf{x}\Vert=\Vert\mathbf{x}\Vert ,平方后整理可得 \mathbf{x}^\ast (U^\ast U-I)\mathbf{x}=0 ,可知 (U^\ast U-I)\mathbf{x}=\mathbf{0} ,並推得 U^\ast U-I=0 所以,保長是么正矩陣的一個充要條件。


性質2 .兩向量的內積不因么正變換而改變,即任何 \mathbf{x},\mathbf{y}\in\mathbb{C}^n

(U\mathbf{x})^\ast(U\mathbf{y})=\mathbf{x}^\ast\mathbf{y}

性質2說明么正變換具有內積不變性。 使用定義式,

(U\mathbf{x})^{\ast}(U\mathbf{y})=\mathbf{x}^{\ast}U^{\ast}U\mathbf{y}=\mathbf{x}^{\ast}I\mathbf{y}=\mathbf{x}^{\ast}\mathbf{y}

將上式的 \mathbf{y} 替換為 \mathbf{x} ,性質2可推得性質1。 所以,內積不變性是么正矩陣的另一個充要條件。


性質3 .么正矩陣的特征值之絕對值為 1

假設 U\mathbf{x}=\lambda\mathbf{x} ,等號兩邊同時取向量長度。 利用性質1,等號左邊為 \Vert U\mathbf{x}\Vert=\Vert\mathbf{x}\Vert ,但等號右邊為 \Vert\lambda\mathbf{x}\Vert=\vert\lambda\vert \cdot\Vert\mathbf{x}\Vert ,所以 \vert\lambda\vert=1 ,換句話說,么正矩陣的特征值可表示為 \lambda=e^{i\theta}


性質4 .么正矩陣 U 可么正對角化, U=VDV^\ast ,其中 V 是一么正矩陣, D=\hbox{diag}(\lambda_1,\ldots,\lambda_n)

么正矩陣 U 滿足 U^\ast U=UU^\ast ,因此屬於正規矩陣家族,本身也可被么正對角化。 下面介紹 U 對應相異特征值的特征向量互為正交的一個證明。 假設非零向量 \mathbf{x} \mathbf{y} 使得 U\mathbf{x}=\lambda_1\mathbf{x} U\mathbf{y}=\lambda_2\mathbf{y} ,且 \lambda_1\neq\lambda_2 使用性質2,

\mathbf{x}^{\ast}\mathbf{y}=(U\mathbf{x})^{\ast}(U\mathbf{y})=(\lambda_1\mathbf{x})^{\ast}(\lambda_2\mathbf{y})=(\overline{\lambda_1}\lambda_2)(\mathbf{x}^{\ast}\mathbf{y})

比較等號兩邊,推得 \overline{\lambda_1}\lambda_2=1 \mathbf{x}^{\ast}\mathbf{y}=0 使用性質三,令 \lambda_1=e^{i\theta_1} ,則 \overline{\lambda_1}\lambda_1=e^{-i\theta_1}e^{i\theta_1}=1 但已知 \lambda_1 不等於 \lambda_2 ,推論 \overline{\lambda_1}\lambda_2\neq 1 ,證明 \mathbf{x} 正交於 \mathbf{y}


性質5 .么正矩陣 U 的行列式為 \vert\det U\vert=1

根據性質3, U 的特征值滿足 \vert\lambda_i\vert=1 行列式等於特征值之積,故 \vert\det U\vert=\vert \lambda_1\cdots\lambda_n\vert=\vert\lambda_1\vert\cdots\vert\lambda_n\vert=1 另一個作法計算

\det(U^\ast U)=(\det \overline{U^T})(\det U)=(\overline{\det U^T})(\det U)=(\overline{\det U})(\det U)=\vert\det U\vert^2

\det(U^\ast U)=\det I=1 ,所以 \vert\det U\vert=1


對於一實正交矩陣 Q \det Q 為實數,由性質5可知 \det Q=\pm 1 據此,實正交矩陣可以區分為兩類:若 \det Q=1 ,則 Q 稱為適當的(proper) 的正交矩陣;若 \det Q=-1 ,則 Q 稱為不適當的正交矩陣。 R(\theta) 是平面上逆時針旋轉角為 \theta 的旋轉矩陣, F(\phi) 是平面上以 \begin{bmatrix}  \cos\phi\\  \sin\phi  \end{bmatrix} 為鏡射軸指向的鏡射矩陣,公式如下(見“ 幾何變換矩陣的設計 ”):

R(\theta)=\left[\!\!\begin{array}{cr}  \sin\theta&-\cos\theta\\  \cos\theta&\sin\theta  \end{array}\!\!\right],~~F(\phi)=\left[\!\!\begin{array}{cr}  \cos 2\phi&\sin 2\phi\\  \sin 2\phi&-\cos 2\phi  \end{array}\!\!\right]

因為 \det R(\theta)=\cos^2\theta+\sin^2\theta=1 ,平面旋轉是適當的正交矩陣。 另一方面, \det F(\phi)=-(\cos^2 2\phi+\sin^2 2\phi)=-1 ,平面鏡射是不適當的正交矩陣(見“ 旋轉與鏡射 ”)。 平面旋轉與鏡射是保長變換,提示我們這兩種矩陣是實正交矩陣。


最后補充一個么正矩陣的充分條件:假設 n\times n 階矩陣 A 的特征值 \lambda 滿足 \vert\lambda\vert=1 若每一 \mathbf{x}\in\mathbb{C}^n 使得 \Vert A\mathbf{x}\Vert\le\Vert\mathbf{x}\Vert ,則 A 是一個么正矩陣(見“ 每周問題July 6, 2015 ”)。 注解提供兩個證明:第一個證明使用奇異值分解[1] ,第二個證明使用矩陣三角化的Schur定理[2]


注解
[1] 令 A 的特征值為 \lambda_1,\ldots,\lambda_n ,奇異值為 \sigma_1,\ldots,\sigma_n\ge 0 給定的不等式等價於

\displaystyle  \Vert A\Vert_2=\max_{\Vert\mathbf{x}\Vert\neq\mathbf{0}}\frac{\Vert A\mathbf{x}\Vert}{\Vert\mathbf{x}\Vert}=\sigma_{\max}\le 1

其中 \sigma_{\max}=\max_{1\le i\le n}\sigma_i A 的奇異值分解為 A=U\Sigma V^\ast ,其中 \Sigma=\text{diag}(\sigma_1,\ldots,\sigma_n) U^\ast U=V^\ast V=I 使用恆等式 \det(A^\ast A)=\vert\det A\vert^2 ,又 \det(A^\ast A)=\det(\Sigma^\ast\Sigma)=\sigma_1^2\cdots\sigma_n^2 \det A=\lambda_1\cdots\lambda_n ,推得 \sigma_1\cdots\sigma_n=\vert \lambda_1\cdots\lambda_n\vert=\vert\lambda_1\vert\cdots\vert\lambda_n\vert=1 \sigma_{\max}\le 1 ,可知 \sigma_1=\cdots=\sigma_n=1 因此, A=U\Sigma V^\ast=UIV^\ast=UV^\ast ,即知 A^\ast A=VU^\ast UV^\ast=I ,證明 A 是一么正矩陣。

[2] 根據Schur 定理,寫出 A=UTU^\ast ,其中 U 是么正矩陣, T=[t_{ij}] 是上三角矩陣,主對角元為 A 的特征值 \lambda_1,\ldots,\lambda_n ,每一 \vert\lambda_i\vert=1 考慮 \mathbf{x}=U\mathbf{e}_n ,其中 \mathbf{e}_n=(0,\ldots,0,1)^T 是第 n 個標准單位向量,則 \Vert\mathbf{x}\Vert=\Vert U\mathbf{e}_n\Vert=(\mathbf{e}_n^\ast U^\ast U\mathbf{e}_n)^{1/2}=1 我們得到

\displaystyle  \Vert A\mathbf{x}\Vert=\Vert UTU^\ast U\mathbf{e}_n\Vert=\Vert UT\mathbf{e}_n\Vert=\Vert T\mathbf{e}_n\Vert=\left(\vert t_{1n}\vert^2+\cdots+\vert t_{n-1,n}\vert^2+\vert\lambda_n\vert^2\right)^{1/2}

對於單位向量 \mathbf{x} ,給定條件等價於 \Vert A\mathbf{x}\Vert\le 1 ,再有 \vert\lambda_n\vert=1 ,使得 t_{in}=0 1\le i\le n-1 套用歸納法,重復上述步驟令 \mathbf{x}=U\mathbf{e}_j j=n-1,n-2,\ldots,2 ,可推論 T 是一個對角矩陣滿足 T^\ast T=I (因為 \overline{\lambda_i}\lambda_i=\vert\lambda_i\vert^2=1 )。 所以,

A^\ast A=UT^\ast U^\ast UTU^\ast=UT^\ast TU^\ast=UU^\ast =I

相關閱讀:


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM