以下內容部分摘自同濟大學數學系《工程數學.線性代數(第五版)》
矩陣與行列式基礎
向量的定義
一組有序的數被稱作 向量。
形式化地,設有數域 \(S\),對於有序的 \(n\) 個數組成的數組 \(a_1,a_2,\dots,a_n \in S\),稱 \((a_1,a_2,\dots,a_n)\) 為 \(S^n\) 上的一個 \(n\) 維向量。其中,第 \(i\) 個數 \(a_i\) 被稱作第 \(i\) 個分量。
矩陣的定義
稱一個 \(m \times n\) 的矩形數表
為一個 \(m \times n\) 的矩陣,一般在兩側加括號表示這是個矩陣,並用大寫字母來表示,記作:
矩陣中的數被叫做矩陣的元素,簡稱元。其中的數 \(a_{i,j} \ (i \in \{1,2,\dots,m\},j\in\{1,2,\dots,n\})\) 被稱作矩陣 \(A\) 的 \((i,j)\) 元。以數 \(a_{i,j}\) 為 \((i,j)\) 元的矩陣可記作 \((a_{i,j})\)。有時為強調矩陣大小記作 \((a_{i,j})_{m\times n}\)。 \(m\times n\) 矩陣 \(A\) 也可記作 \(A_{m,n}\)。
特別地,對於 \(m = n\) 的矩陣 \(A\) 稱為 \(n\) 階矩陣/方陣,也記作 \(A_n\)。
元素全為實數的矩陣稱為實矩陣,是復數的稱為復矩陣。以下若無特殊說明均為實矩陣。
稱 \(n = 1\) 的矩陣為列矩陣,又稱列向量,記作 \(A = (a_1,a_2\dots,a_n)\)。
同理可定義行矩陣(\(n = 1\)),記作 \(A = (a_1,a_2\dots,a_n)^\top\)。
兩個矩陣的行數、列數都相等時,稱兩個矩陣為同型矩陣。
一個 \(n\) 階方陣的主對角線上方的元素全為零,即 \(\forall i<j,a_{i,j}=0\) 時,稱其為下三角矩陣。
同理可定義上三角矩陣。
\(\forall i \neq j,a_{i,j}=0\) 的 \(n\) 階方陣被稱為 \(n\) 階對角矩陣,簡稱對角陣,記作 \(\text{diag}(a_1,a_2,\dots,a_n)\)。若 \(a_1=a_2=\dots=a_n\),稱其為數量矩陣或純量陣。若還有 \(a_1=a_2=\dots=a_n=1\),則稱其為 \(n\) 階單位矩陣,記為 \(I_n\) 或 \(E_n\),通常簡記為 \(I\) 或 \(E\) 。數量矩陣記為 \(\lambda I(\lambda\in\Z^+)\)。
元素全為零的矩陣稱作零矩陣,記作 \(O\) 或 \(O_{m,n}\)。
矩陣的運算
矩陣的相等
若兩個矩陣 \(A=(a_{i,j}),B=(b_{i,j})\) 為同型矩陣且有 \(a_{i,j}=b_{i,j}\),則這兩個矩陣相等。記作 \(A = B\)。
矩陣的和差
設有兩個 \(m \times n\) 的同型矩陣 \(A=(a_{i,j}), B = (b_{i,j})\) ,定義他們的和為
容易發現矩陣的加法滿足
- 交換律:\(A+B=B+A\)
- 結合律:\((A+B)+C = A+(B+C)\)
我們稱矩陣 \(-A=(-a_{i,j})\) 為矩陣 \(A\) 的負矩陣,規定矩陣 \(A,B\) 的差為 \(A + (-B)\) 。
矩陣的數乘
數 \(\lambda\) 與矩陣 \(A=(a_{i,j})\) 的乘積記作 \(\lambda A\) 或 \(A\lambda\) ,規定為
不難發現矩陣的數乘滿足如下運算律(以下 \(A,B\) 為 \(m\times n\) 的矩陣,\(\lambda,\mu\) 為數):
- \((\lambda\mu) A=\lambda(\mu A)\)
- \((\lambda A)\mu=\lambda(A\mu)\)
- \((\lambda + \mu) A = \lambda A + \mu A\)
- \(\lambda (A + B) = \lambda A + \lambda B\)
矩陣相加與矩陣數乘統稱為矩陣的 線性運算 。
矩陣相乘
矩陣乘法
設 \(A=(a_{i,j})\) 為 \(m\times s\) 的矩陣, \(B=(b_{i,j})\) 為 \(s \times n\) 的矩陣,定義矩陣 \(A\) 與矩陣 \(B\) 的乘積是一個 \(m \times n\) 的矩陣 \(C = (c_{i,j})\),其中
矩陣的乘法不滿足交換律,在進行兩個矩陣的相乘時必須要注意運算順序。
對於矩陣 \(A, B\), 若 \(AB\) 與 \(BA\) 均有意義,則稱 \(AB\) 是 \(A\) 左乘 \(B\)(\(B\) 被 \(A\) 左乘)的乘積,\(BA\) 是 \(A\) 右乘 \(B\)(\(B\) 被 \(A\) 右乘)的乘積。
雖然矩陣乘法不滿足交換律,但仍然滿足下列結合律與分配律:
- \((AB)C=A(BC)\)
- \(\lambda (AB) = (\lambda A)B=A(\lambda B)\)
- \(A(B + C) = AB + AC, (B + C)A = BA + CA\)
矩陣的冪
我們可以利用矩陣乘法定義矩陣的冪:
設 \(A\) 是 \(n\) 階方陣,定義 \(A^1=A,A^{k+1}=A^kA\ (k\in \Z^+)\),即 \(k\) 個 \(A\) 連乘。
向量的旋轉
對於向量 \(\overrightarrow{OP}=\begin{pmatrix}x\\y\end{pmatrix}\),被矩陣 \(A=\begin{bmatrix}\cos\alpha&-\sin\alpha\\\sin\alpha&\cos\alpha\end{bmatrix}\) 左乘等價於將其旋轉 \(\alpha\) 角。
證明:
-
考慮向量 \(\overrightarrow{OP}=\begin{pmatrix}1\\0\end{pmatrix}\),左乘 \(A\) 得到:
\[\begin{aligned} \overrightarrow{OP'} &= \begin{bmatrix}\cos\alpha&-\sin\alpha\\\sin\alpha&\cos\alpha\end{bmatrix}\begin{pmatrix}1\\0\end{pmatrix} \\ &= \begin{pmatrix}\cos\alpha\\\sin\alpha \end{pmatrix} \end{aligned} \] -
考慮旋轉 \(\alpha\) 之后,再旋轉 \(\beta\) 角:
\[\begin{aligned} &\begin{bmatrix}\cos\beta&-\sin\beta\\\sin\beta&\cos\beta\end{bmatrix}\begin{bmatrix}\cos\alpha&-\sin\alpha\\\sin\alpha&\cos\alpha\end{bmatrix}\\ &= \begin{bmatrix}\cos\beta\cos\alpha-\sin\beta\sin\alpha &-\cos\beta\sin\alpha-\sin\beta\cos\alpha\\ \sin\beta\cos\alpha+\cos\beta\sin\alpha& -\sin\beta\sin\alpha+\cos\beta\cos\alpha\end{bmatrix}\\ &=\begin{bmatrix}\cos(\alpha+\beta)&-\sin(\alpha+\beta)\\\sin(\alpha+\beta)&\cos(\alpha+\beta)\end{bmatrix} \end{aligned} \]
即對向量 \(\overrightarrow{OP}\) 左乘 \(B=\begin{bmatrix}\cos\beta&-\sin\beta\\\sin\beta&\cos\beta\end{bmatrix}\),相當於將 \(\begin{pmatrix}1\\0\end{pmatrix}\) 旋轉 \(\alpha\) 角至 \(\overrightarrow{OP}\),再旋轉 \(\beta\) 角。
矩陣的轉置
假設有 \(m \times n\) 的矩陣 \(A\),定義其轉置矩陣為其行列交換的 \(n \times m\) 的矩陣,記作 \(A^\top\)。
\(\forall i\in\{1,2,\dots,m\},j\in\{1,2,\dots,n\}\),\(A^\top\) 中的 \((j,i)\) 元等於 \(A\) 中的 \((i,j)\) 元。
寫出來就是沿左上
矩陣的轉置同樣可以看作一種運算,且滿足如下性質:
-
\((A^\top)^\top=A\)。
-
\((A+B)^\top = A^\top + B^\top\)。
證:設 \(C=A+B\),則 \(c_{i,j}=a_{i,j}+b_{i,j} \Rightarrow c_{j,i}=a_{j,i}+b_{j,i} \Rightarrow C^\top = A^\top + B^\top\)。
-
\((\lambda A)^\top = \lambda (A^\top)\) 。
證:\((\lambda A)^\top=(\lambda a_{i,j})^\top=(\lambda a_{j,i})=\lambda(a_{j,i})=\lambda A^\top\)。
-
\((AB)^\top=B^\top A^\top\)。
證:設 \(A=(a_{i,j})_{m\times s},B=(b_{i,j})_{s \times n}\),設 \(C=(c_{i,j})_{m\times n}=AB\),則 \(c_{i,j}=\sum_{k=1}^s a_{i,k}b_{k,j}\)。
交換行列,得到 \(c_{j,i}=\sum_{k=1}^s a_{k,i}b_{j,k}\)。
再交換 \(i,j\),得到 \(c_{i,j}=\sum_{k=1}^s b_{i,k}a_{k,j}\),得證。
若方陣 \(A\) 滿足 \(A=A^\top\),則稱 \(A\) 為對稱矩陣,簡稱對稱陣。
矩陣的逆
設 \(A\) 為 \(n\) 階矩陣,若存在另一個矩陣 \(B\) 使得 \(AB=BA=E\),則稱方陣 \(A\) 可逆,並稱 \(B\) 是 \(A\) 的逆矩陣,記作 \(A^{-1}\)。
矩陣的逆有以下性質:
-
\(E=E^{-1}\)
-
\((A^{-1})^{-1}=A\)
-
零矩陣不可逆。
-
若 \(A\) 可逆,則 \(A^{-1}\) 唯一。
證:設 \(AB=E,AC=E\),則有 \(B=BE=B(AC)=(BA)C=EC=C\)。
-
若 \(A\) 可逆,則 \(A^\top\) 可逆,且 \((A^\top)^{-1}=(A^{-1})^\top\)。
-
若 \(A,B\) 為同階方陣且均可逆,則 \(AB\) 亦可逆,且 \((AB)^{-1}=B^{-1}A^{-1}\)。
行列式的定義
設 \(1 \sim n\) 的全排列組成的集合為 \(\pi(n)\),排列 \(P\) 的第 \(i\) 個位置的元素為 \(p_i\),排列 \(P\) 的逆序對數(本文假設標准序列為 \(1,2,\dots,n\))為 \(r(P)\),則定義以下 \(n\) 階數表:
的行列式為:
,記作
也簡記為 \(\det(a_{ij})\)。
(惡臭的寫法:\(\large \sum_{P\in \pi(n)}\frac{\prod_{k=1}^n a_{k,p_k}\prod_{1\leq i < j \leq n}(a_i-a_j)}{|\prod_{1\leq i < j \leq n}(a_i-a_j)|}\))
容易發現,對於 \(n\) 階方陣 \(A\),我們同樣可以定義:由 \(A\) 中元素構成的行列式稱為 \(A\) 的行列式,記作 \(|A|\) 或 \(\det(A)\)。
注意:
- 只有方陣有行列式,行列式必須是 \(n \times n\) 的數表。
- 方陣是一個矩陣,行列式是一個數。
行列式的性質與運算
表示方法
我們稱 \(r_i(i \in\{1,2,\dots,n\})\) 表示第 \(i\) 行, \(c_i(i\in\{1,2,\dots,n\})\) 表示第 \(i\) 列。
基本行列操作
交換行列式的任意兩行(列),行列式變號。
交換行列,對於原本的求積順序來說,會使排列奇偶性改變(證明見行列式的轉置-引理 1),因此求和符號內所有符號都要變,因此行列式變號。
交換記作 \(r_i\leftrightarrow r_j\)。
推論:如果存在任意兩行(列)元素相同,則該行列式 \(D=0\)。
交換,有 \(D = -D \Rightarrow D=0\)。
對矩陣任意一行(列)乘 \(k\),會使其行列式乘 \(k\)。
求積的時候必然會乘上一個且只會乘上一個該行(列)的數,因此整體放大 \(k\) 倍。
可以利用這一性質來進行化簡,例如把公因數提取到行列式外。
另外,由此可以證明 \(|\lambda A|=\lambda^n|A|\)。
推論:如果有兩行(列)的元素成比例,則該行列式 \(D=0\)。
提取公因數后兩行(列)相同。
行列式的和
設有行列式
則
證:在 \(\prod_{i=1}^n a_{i,p_i}\) 的任意一項中使用乘法分配律即可。
注意到三個行列式同時交換某兩行(列)並沒有影響,因此這一法則實際上對任意一行(列)的加法都適用。
推論 1:將行列式的任意一行(列)放大 \(k\) 倍加到零一行(列)上,行列式值不變。
相當於加了一個值為零的行列式。
將第 \(i\) 行加上 \(k\) 倍 \(j\) 行記作 \(r_i+kr_j\)(不能套用加法交換律!)。
以上操作被稱為初等行變換。
行列式的轉置
下證 \(|A^\top|=|A|\)。
引理 1:交換任意排列的任意兩個數,該排列奇偶性改變。
證:
- 首先考慮交換相鄰的兩個數,那么這兩個數與其它數的相對關系不會發生改變,僅這兩個數產生逆序或逆序消失,排列奇偶性改變。
- 假設交換的兩個數為 \(p_i,p_j(1\le i < j \le n)\),我們可以看作是先交換 \(p_i,p_{i+1}\),再交換 \(p_{i+1},p_{i+2}\),直到交換 \(p_{j-1},p_j\),然后再回過頭交換 \(p_{j-1},p_{j-2}\),直到交換 \(p_{i+1},p_i\),一共交換了 \(2(j - i) - 1\) 次。由於操作次數為奇數,因此排列的奇偶性改變。
推論:奇排列變為標准排列需要交換奇數次,偶排列則需要偶數次。
易證。
引理 2:定義排列 \(q_i\) 為滿足 \(p_{q_i}=i\) 的排列 \(q\),則有 \(q\) 與 \(p\) 一一對應,且 \(r(q)=r(p)\)。
證:
-
由於排列中每個數僅出現一次,所以進行一次上述構造操作(以下稱“逆置換”)得到的序列唯一。
若我們將 \(p\) 的下標和值互換,得到的序列滿足 \(q\) 的定義,因此對 \(p\) 進行一次逆置換相當於交換 \(p\) 的值和下標。
那么交換兩次得到的將是原序列,所以 \(p\) 唯一對應 \(q\),\(q\) 也唯一對應 \(p\)。
推論:\(q_{p_i}=i\)
-
首先我們不妨設 \(q=1,2,\dots,n\),將 \(p_i\) 寫作 \(p_{q_i}\),則我們對 \(p\) 進行排序后進行一次逆置換即可得到 \(q\)。
設將 \(p\) 變為標准序列至少需要 \(k\) 次交換,\(p\) 變為有序的同時,下標也變為了序列 \(q\),那么 \(q\) 也進行了 \(k\) 次交換,即 \(p\) 變為 \(1,\dots,n\) 需要 \(k\) 次交換,\(1,\dots,n\) 變為 \(q\) 也要 \(k\) 次交換,則 \(p\) 變為 \(q\) 需要 \(2k\) 次交換,因此奇偶性不變。
定理 1:以下定義與行列式的定義等價:
\[D=\sum_{P \in \pi(n)}(-1)^{r(P)} \prod_{i=1}^n a_{p_i,i} \]
證:
考慮將 \(p\) 用逆置換 \(q\) 來表示:
第一步使用的是引理 2 推論,第二步利用了 \(p\) 與 \(q\) 一一對應,第三步用的是 \(r(P)=r(Q)\),第四步是因為我們並不關心 \(p\) 的求積順序,因為對於一個確定的 \(Q\),它的 \(P\) 一定是唯一的,本質上也是利用了一一對應。
由於轉置可以將列轉化為行,因此下文中除特別強調,否則行可以的操作列也可以。
上三角行列式與下三角行列式
對於下三角行列式,我們可以較為簡單的求出其值,為其對角線之積:
證:下三角行列式中,縱坐標永遠小於等於橫坐標,因此有 \(\forall i \in\{1,2,\dots,n\}, p_i \le i\),滿足該性質的排列有且僅有 \(1,2,\dots,n\)。
上三角矩陣可轉置為下三角矩陣,因此也滿足該性質。
利用初等行變換可以將任意行列式轉化為上三角行列式或下三角行列式,即高斯消元。
高斯消元法將行列式化為下三角行列式分為以下步驟:
- 對於前 \(1 \sim n-1\) 行,設當前考慮到第 \(k\) 行,我們利用初等行變換將 \(a_{k,n}\) 變為 \(0\),即進行 \(r_k-\frac{a_{k,n}}{a_{n,n}}r_n\),最終會將整個第 \(n\) 列除 \(a_{n,n}\) 以外全部化為 \(0\)。
- 之后僅需將左上角的 \(n-1\) 階方陣化為下三角矩陣,重復以上步驟。
行列式相乘
設有行列式 \(A=(a_{i,j})_m,B=(b_{i,j})_n\),他們的積為 \(D\),則有:
其中 \(c_{i,j}\) 為任意數。
證:僅對前 \(1 \sim m\) 行做初等行變換,相當於將 \(A\) 化為下三角矩陣。同理也可將 \(B\) 化為下三角矩陣,兩部分互不影響,同時將 \(D\) 化為了下三角矩陣。
設有 \(n\) 階方陣 \(A,B\),則有運算律:\(|AB|=|A||B|\)。
證:構造如下的 \(2n \times 2n\) 的方陣:
對該行列式進行如下的變換:\(c_{n+i}=\sum_{k=1}^n b_{k,i}c_i\),原行列式變為 \(D=\begin{vmatrix}A&M\\-E&O\end{vmatrix}\),其中 \(m_{i,j}=\sum_{k=1}^na_{i,k}b_{k,j}\),即\(M=AB\)。
再進行 \(n\) 次交換,使其變為 \(\begin{vmatrix}M&A\\O&-E\end{vmatrix}=(-1)^nD\)。
而該行列式的值同時等於 \(|M||-E|=(-1)^n|M||E|\),兩邊約掉得到 \(|AB|=|M|=D=|A||B|\),證畢。
子式,余子式與代數余子式
定義與性質
在 \(n\) 階行列式中,把 \((i,j)\) 元 \(a_{i,j}\) 所在的第 \(i\) 行和第 \(j\) 列划去后,留下的 \(n-1\) 階行列式被稱作 \((i,j)\) 元 \(a_{i,j}\) 的余子式,記作 \(M_{i,j}\)。
記 \(A_{i,j}=(-1)^{i+j}M_{i,j}\) 為其代數余子式。
引理:對於一個 \(n\) 階行列式,如果第 \(i\) 行除 \(a_{i,j}\) 外的元素均為 \(0\),那么有 \(D=a_{i,j}A_{i,j}\)。
證:
-
首先考慮當 \((1,1)\) 不為 \(0\) 的時候,則若選中第一行的 \(2 \sim n\) 元素,對結果的貢獻必然為零。若選中 \(a_{1,1}\),則之后不會再選第一列。
因此只需考慮右下角的 \(n-1\) 階行列式。由於 \((1,1)\) 不會與任何值產生逆序,因此不會對正負性產生影響。
-
考慮 \((i,j)\) 元不為 \(0\) 的情況,可以先將其與 \((i-1,j)\) 交換,再與 \((i-2,j)\) 交換,直到進行 \(i-1\) 次交換將其移動到第一行。同理進行 \(j-1\) 次交換將其移動到第一列。那么一共交換了 \(i + j - 2\) 次,行列式變為 \((-1)^{i+j-2}D=(-1)^{i+j}D\),與代數余子式的定義相吻合。
定理 2(行列式按行(列)展開法則):行列式等於它的任意一行的各元素與其對應的代數余子式乘積之和。
考慮其代數余子式,相當於假設它這一行列除本身外全部為零。由引理與行列式的性質易證。
推論:行列式_某一行的元素_與_另一行的對應元素的代數余子式_的乘積之和等於零,即:
\(\forall i\neq j\in\{1,2,\dots,n\},\sum_{k=1}^n a_{i,k}A_{j,k}=0\)
證:由定理 2,我們知道 \(D=\sum_{k=1}^n a_{j,k}A_{j,k}\),則 \(\sum_{k=1}^n a_{i,k}A_{j,k}\) 等價於 \(r_j=r_i\),而這樣的行列式等於零。
也因此,我們推導出有關於代數余子式的重要性質:
伴隨矩陣
設有 \(n\) 階矩陣 \(A\),定義行列式 \(|A|\) 的伴隨矩陣為其中_每一個元素的代數余子式_在_對應位置_組成的矩陣的轉置,記為 \(A^*\)。
即:
伴隨矩陣滿足以下性質:
- \(A\) 可逆當且僅當 \(A^*\) 可逆。
- 若 \(A\) 可逆,則 \(A^*=|A|A^{-1}\)。
- 若 \(A\) 可逆,則 \((A^{-1})^*=(A^*)^{-1}\)。
- \(|A^*|=|A|^{n-1}\)。
- \((kA)^*=k^{n-1}A^*\)。
- \((A^\top)^*=(A^*)^\top\)。
- \((AB)^*=B^*A^*\)。
- \(AA^*=A^*A=|A|E\)。
克拉默法則
設有線性方程組 \(A \overrightarrow X= \overrightarrow B\),其中 \(A\) 為 \(n \times n\) 的系數矩陣, \(B\) 為 \(n \times 1\) 的常數矩陣,若 \(|A|=D \neq 0\),那么該方程有唯一解\(x_i=\frac{D_i}{D}\),其中 \(D_i\) 為將 \(D\) 中第 \(j\) 列替換成 \(B\) 所得的行列式,由定理 2 可知 \(D_i=\sum_{k=1}^n b_kA_{k,i}\)。
證:
由於 \(|D|\neq0\),因此可以通過高斯消元法將 \(A\) 化為下三角矩陣求解。
考慮寫出增廣矩陣(即 \(A|b\) ),並且化為行階梯矩陣:
考慮 \((1,1)\) 元:化簡后不難看出 \(b'_1=x_1a'_{1,1}\),可以解得
而對於其它的 \(x_i (i\ge2)\),我們不妨進行操作 \(c_1\leftrightarrow c_i\),這樣就使 \(x_1\) 和 \(x_i\) 交換了位置。此時,\(D_i\) 和 \(D\) 均變號,解為 \(x_i=\frac{-D_i}{-D}=\frac{D_i}{D}\)。
向量、向量組與線性相關
由若干個同維數的向量組成的集合叫做向量組。因此,一個 \(m \times n\) 的矩陣可以看作 \(n\) 個 \(m\) 維列向量組成的向量組,也可以看做 \(m\) 個 \(n\) 維行向量組成的向量組。
對於給定的一個向量組 \(A:a_1,a_2,\dots,a_n\),則對於任意一組實數 \(\lambda_1,\lambda_2,\dots,\lambda_n\),稱 \(\sum_{i=1}^n \lambda_ia_i\) 為 \(A\) 的一個線性組合。\(A\) 的所有線性組合組成的集合被稱作 \(A\) 的張成(span)。
若 \(A\) 滿足:\(\forall a \in A, a \notin \text{Span}(A \setminus a)\),則稱 \(A\) 線性相關,否則稱其線性無關。
即不存在不全為 0 的實數組滿足 \(\sum a_i\lambda_i=0\)。
矩陣的秩,初等變換
秩分為列秩和行秩,是矩陣的線性無關的縱列/橫行的極大數目。
咕咕咕