定義
定義 1
如果:AA'=E(E為單位矩陣,A'表示“矩陣A的轉置矩陣”。)或A′A=E,則n階實矩陣 A稱為正交矩陣, 若A為正交陣,則滿足以下條件:
1) A 是正交矩陣
2) AA′=E(E為單位矩陣)(#add它的轉置矩陣是它的逆矩陣,這是很重要的)
3) A′是正交矩陣
4) A的各行是單位向量且兩兩正交
5) A的各列是單位向量且兩兩正交
6) (Ax,Ay)=(x,y) x,y∈R
正交矩陣通常用字母Q表示。
舉例:A=[r11 r12 r13;r21 r22 r23;r31 r32 r33]
則有:
正交方陣是歐氏空間中標准正交基到標准正交基的過渡矩陣。
在
矩陣論中,
實數
正交矩陣是
方塊矩陣 Q,它的
轉置矩陣是它的
逆矩陣:
,如果正交矩陣的
行列式為 +1,則我們稱之為
特殊正交矩陣:
概述
要看出與內積的聯系,考慮在
n 維實數
內積空間中的關於正交基寫出的向量
v。
v 的長度的平方是
vv。如果矩陣形式為
Q
v 的線性變換保持了向量長度,則
所以有限維線性
等距同構,比如
旋轉、
反射和它們的組合,都產生正交矩陣。反過來也成立: 正交矩陣蘊涵了正交變換。但是,
線性代數包括了在既不是有限維的也不是同樣維度的空間之間的
正交變換,它們沒有等價的正交矩陣。
有多種原由使正交矩陣對理論和實踐是重要的。
n×
n 正交矩陣形成了一個
群,即指示為
O(
n) 的
正交群,它和它的子群廣泛的用在數學和物理科學中。例如,分子的
點群是
O(3) 的子群。因為浮點版本的正交矩陣有有利的性質,它們是字數值線性代數中很多算法比如 QR分解的關鍵,通過適當的規范化,
離散余弦變換 (用於
MP3 壓縮)可用正交矩陣表示。
例子
下面是一些小正交矩陣的例子和可能的解釋。
恆等變換。 旋轉 16.26°。 針對
x 軸反射。 旋轉反演(rotoinversion): 軸 (0,-3/5,4/5),角度90°。 置換坐標軸。
基本構造
低維度
最簡單的正交矩陣是 1×1 矩陣 [1] 和 [−1],它們可分別解釋為恆等和實數線針對原點的反射。
如下形式的 2×2 矩陣
它的正交性要求滿足三個方程
在考慮第一個方程時,不丟失一般性而設
p = cos θ,
q = sin θ;因此要么
t = −
q,
u =
p 要么
t =
q,
u = −
p。我們可以解釋第一種情況為旋轉 θ(θ = 0 是單位矩陣),第二個解釋為針對在角 θ/2 的直線的反射。
旋轉 反射 在 45°的反射對換
x 和
y;它是
置換矩陣,在每列和每行帶有一個單一的 1(其他都是 0):
單位矩陣也是置換矩陣。
反射是它自己的逆,這蘊涵了反射矩陣是
對稱的(等於它的轉置矩陣)也是正交的。兩個旋轉矩陣的積是一個旋轉矩陣,兩個反射矩陣的積也是旋轉矩陣。
更高維度
不管維度,總是可能把正交矩陣按純旋轉與否來分類,但是對於 3×3 矩陣和更高維度矩陣要比反射復雜多了。例如,
和 表示通過原點的
反演和關於
z 軸的旋轉反演(逆時針旋轉90°后針對
x-
y平面反射,或逆時針旋轉 270°后對原點反演)。
旋轉也變得更加復雜;它們不再由一個角來刻畫,並可能影響多於一個平面子空間。盡管經常以一個軸和角來描述 3×3 旋轉矩陣,在這個維度旋轉軸的存在是偶然的性質而不適用於其他維度。
但是,我們有了一般適用的基本建造板塊如置換、反射、和旋轉。
基本變換
最基本的置換是換位(transposition),通過交換單位矩陣的兩行得到。任何
n×
n 置換矩陣都可以構造為最多
n−1 次換位的積。 構造自非零向量
v 的 Householder反射為
這里的分子是對稱矩陣,而分母是
v 的平方量的一個數。這是在垂直於
v 的超平面上的反射(取負平行於
v 任何向量分量)。如果
v 是單位向量,則
Q =
I−2
vv 就足夠了。Householder 反射典型的用於同時置零一列的較低部分。任何
n×
n 正交矩陣都可以構造為最多
n 次這種反射的積。
Givens旋轉作用於由兩個坐標軸所生成的二維(平面)子空間上,按選定角度旋轉。它典型的用來置零一個單一的次對角線元素(subdiagonal entry)。任何
n×
n 的旋轉矩陣都可以構造為最多
n(
n−1)/2 次這種旋轉的積。在 3x3 矩陣的情況下,三個這種旋轉就足夠了;並且通過固定這個序列,我們可以用經常叫做
歐拉角的三個角來(盡管不唯一)描述所有 3×3 旋轉矩陣。
雅可比旋轉有同 Givens 旋轉一樣的形式,但是被用做
相似變換,選擇來置零 2×2 子矩陣的兩個遠離對角元素(off-diagonal entry)。
性質
矩陣性質
實數方塊矩陣是正交的,當且僅當它的列形成了帶有普通歐幾里得
點積的
歐幾里得空間
R 的正交規范基,它為真當且僅當它的行形成
R 的正交基。假設帶有正交(非正交規范)列的矩陣叫正交矩陣可能是誘人的,但是這種矩陣沒有特殊價值而沒有特殊名字;他們只是
MM =
D,
D 是
對角矩陣。
任何正交矩陣的行列式是 +1 或 −1。這可從關於行列式的如下基本事實得出:
反過來不是真的;有 +1 行列式不保證正交性,即使帶有正交列,可由下列反例證實。
對於置換矩陣,行列式是 +1 還是 −1 匹配置換是偶還是奇的
標志,行列式是行的交替函數。
比行列式限制更強的是正交矩陣總可以是在復數上可對角化來展示特征值的完全的集合,它們全都必須有(復數)絕對值 1。
群性質
正交矩陣的逆是正交的,兩個正交矩陣的積是正交的。事實上,所有
n×
n 正交矩陣的集合滿足群的所有公理。它是
n(
n−1)/2 維的
緊致
李群,叫做正交群並指示為
O(
n)。
行列式為 +1 的正交矩陣形成了路徑連通的子群指標為 2 的
O(
n)
正規子群,叫做旋轉的特殊正交群
SO(
n)。
商群
O(
n)/
SO(
n) 同構於
O(1),帶有依據行列式選擇 [+1] 或 [−1] 的投影映射。帶有行列式 −1 的正交矩陣不包括單位矩陣,所以不形成子群而只是
陪集;它也是(分離的)連通的。所以每個正交群被分為兩個部分;因為投影映射
分裂,
O(
n) 是
SO(
n) 與
O(1)的
半直積。用實用術語說,一個相當的陳述是任何正交矩陣可以通過采用一個旋轉矩陣並可能取負它的一列來生成,如我們在 2×2 矩陣中看到的。如果
n 是奇數,則半直積實際上是
直積,任何正交矩陣可以通過采用一個旋轉矩陣並可能取負它的所有列來生成。
現在考慮 (
n+1)×(
n+1) 右底元素等於 1 的正交矩陣。最后一列(和最后一行)的余下元素必須是零,而任何兩個這種矩陣的積有同樣的形式。余下的矩陣是
n×
n 正交矩陣;因此
O(
n) 是
O(
n+1) (和所有更高維群)的子群。
因為 Householder 正交矩陣形式的基本反射可把任何正交矩陣簡約成這種約束形式,一系列的這種反射可以把任何正交矩陣變回單位矩陣;因此正交群是反射群。最后一列可以被固定為任何單位向量,並且每種選擇給出不同的
O(
n) 在
O(
n+1) 中的復本;以這種方式
O(
n+1) 是在單位球
S 與纖維
O(
n) 上的
叢。
類似的,
SO(
n) 是
SO(
n+1) 的子群;任何特定正交矩陣可以使用類似過程通過 Givens 平面旋轉來生成。叢結構持續:
SO(
n) ↪
SO(
n+1) →
S。一個單一旋轉可以在最后一列的第一行生成一個零,而
n−1 次旋轉序列將置零
n×
n 旋轉矩陣的除了最后一列的最后一行的所有元素。因為平面是固定的,每次旋轉只有一個自由度,就是它的角度。通過歸納,
SO(
n) 因此有
自由度,
O(
n) 也是。
置換矩陣簡單一些;它們不形成李群,只是一個有限群,
n! 次
對稱群
Sn。通過同類的討論,
Sn 是
Sn+1 的子群。偶置換生成行列式 +1 的置換矩陣的子群,
n!/2 次交錯群。
規范形式
更廣泛的說,任何正交矩陣的效果分離到在正交二維空間上的獨立動作。就是說,如果
Q 是狹義正交的,則你可以找到(旋轉)改變基的一個正交矩陣
P,把
Q 帶回到分塊對角形式:
(
n 偶數), (
n 奇數)。 這里的矩陣
R1,...,
Rk 是 2×2 旋轉矩陣,而余下的元素是零。作為例外,一個旋轉塊可以是對角的, ±
I。因此如果需要的話取負一列,並注意 2×2 反射可對角化為 +1 和 −1,任何正交矩陣可變為如下形式
, 矩陣
R1,…,
Rk 給出位於
復平面中單位圓上的特征值的共軛對;所以這個分解復合確定所有帶有絕對值 1 的特征值。如果
n 是奇數,至少有一個實數特征值 +1 或 −1;對於 3×3 旋轉,關聯着 +1 的特征向量是旋轉軸。
數值線性代數
利益
數值分析自然的利用了正交矩陣的很多數值線性代數的性質。例如,經常需要計算空間的正交基,或基的正交變更;二者都采用了正交矩陣的形式。有行列式 ±1 和所有模為 1 的特征值是對數值穩定性非常有利的。 一個蘊涵是
條件數為 1 (這是極小的),所以在乘以正交矩陣的時候錯誤不放大。很多算法為此使用正交矩陣如 Householder反射和 Givens旋轉。有幫助的不只是正交矩陣是可逆的,還有它的逆矩陣本質上是免花費的,只需要對換索引(下標)。
置換是很多算法成功的根本,包括有局部定支點(partial pivoting)的運算繁重的
高斯消去法(這里的置換用來定支點)。但是它們很少明顯作為矩陣出現;它們的特殊形式允許更有限的表示,比如
n 個索引的列表。
同樣的,使用 Householder 和 Givens 矩陣的算法典型的使用特殊方法的乘法和存儲。例如,Givens 旋轉只影響它所乘的矩陣的兩行,替代完全的
n 次的
矩陣乘法為更有效的
n 次運算。在使用這些反射和旋轉向矩陣介入零的時候,騰出的空間足夠存儲充足的數據來重生成這個變換。
分解
一些重要的
矩陣分解(Golub & Van Loan, 1996)涉及到了正交矩陣,包括:
QR分解
M =
QR,
Q 正交,
R 上三角。
奇異值分解
M =
UΣV,
U 和
V 正交,
Σ 非負對角。 譜分解
S =
QΛQ,
S 對稱,
Q 正交,
Λ 對角。 極分解
M =
QS,
Q 正交,
S 對稱非負確定。