以下内容部分摘自同济大学数学系《工程数学.线性代数(第五版)》
矩阵与行列式基础
向量的定义
一组有序的数被称作 向量。
形式化地,设有数域 \(S\),对于有序的 \(n\) 个数组成的数组 \(a_1,a_2,\dots,a_n \in S\),称 \((a_1,a_2,\dots,a_n)\) 为 \(S^n\) 上的一个 \(n\) 维向量。其中,第 \(i\) 个数 \(a_i\) 被称作第 \(i\) 个分量。
矩阵的定义
称一个 \(m \times n\) 的矩形数表
为一个 \(m \times n\) 的矩阵,一般在两侧加括号表示这是个矩阵,并用大写字母来表示,记作:
矩阵中的数被叫做矩阵的元素,简称元。其中的数 \(a_{i,j} \ (i \in \{1,2,\dots,m\},j\in\{1,2,\dots,n\})\) 被称作矩阵 \(A\) 的 \((i,j)\) 元。以数 \(a_{i,j}\) 为 \((i,j)\) 元的矩阵可记作 \((a_{i,j})\)。有时为强调矩阵大小记作 \((a_{i,j})_{m\times n}\)。 \(m\times n\) 矩阵 \(A\) 也可记作 \(A_{m,n}\)。
特别地,对于 \(m = n\) 的矩阵 \(A\) 称为 \(n\) 阶矩阵/方阵,也记作 \(A_n\)。
元素全为实数的矩阵称为实矩阵,是复数的称为复矩阵。以下若无特殊说明均为实矩阵。
称 \(n = 1\) 的矩阵为列矩阵,又称列向量,记作 \(A = (a_1,a_2\dots,a_n)\)。
同理可定义行矩阵(\(n = 1\)),记作 \(A = (a_1,a_2\dots,a_n)^\top\)。
两个矩阵的行数、列数都相等时,称两个矩阵为同型矩阵。
一个 \(n\) 阶方阵的主对角线上方的元素全为零,即 \(\forall i<j,a_{i,j}=0\) 时,称其为下三角矩阵。
同理可定义上三角矩阵。
\(\forall i \neq j,a_{i,j}=0\) 的 \(n\) 阶方阵被称为 \(n\) 阶对角矩阵,简称对角阵,记作 \(\text{diag}(a_1,a_2,\dots,a_n)\)。若 \(a_1=a_2=\dots=a_n\),称其为数量矩阵或纯量阵。若还有 \(a_1=a_2=\dots=a_n=1\),则称其为 \(n\) 阶单位矩阵,记为 \(I_n\) 或 \(E_n\),通常简记为 \(I\) 或 \(E\) 。数量矩阵记为 \(\lambda I(\lambda\in\Z^+)\)。
元素全为零的矩阵称作零矩阵,记作 \(O\) 或 \(O_{m,n}\)。
矩阵的运算
矩阵的相等
若两个矩阵 \(A=(a_{i,j}),B=(b_{i,j})\) 为同型矩阵且有 \(a_{i,j}=b_{i,j}\),则这两个矩阵相等。记作 \(A = B\)。
矩阵的和差
设有两个 \(m \times n\) 的同型矩阵 \(A=(a_{i,j}), B = (b_{i,j})\) ,定义他们的和为
容易发现矩阵的加法满足
- 交换律:\(A+B=B+A\)
- 结合律:\((A+B)+C = A+(B+C)\)
我们称矩阵 \(-A=(-a_{i,j})\) 为矩阵 \(A\) 的负矩阵,规定矩阵 \(A,B\) 的差为 \(A + (-B)\) 。
矩阵的数乘
数 \(\lambda\) 与矩阵 \(A=(a_{i,j})\) 的乘积记作 \(\lambda A\) 或 \(A\lambda\) ,规定为
不难发现矩阵的数乘满足如下运算律(以下 \(A,B\) 为 \(m\times n\) 的矩阵,\(\lambda,\mu\) 为数):
- \((\lambda\mu) A=\lambda(\mu A)\)
- \((\lambda A)\mu=\lambda(A\mu)\)
- \((\lambda + \mu) A = \lambda A + \mu A\)
- \(\lambda (A + B) = \lambda A + \lambda B\)
矩阵相加与矩阵数乘统称为矩阵的 线性运算 。
矩阵相乘
矩阵乘法
设 \(A=(a_{i,j})\) 为 \(m\times s\) 的矩阵, \(B=(b_{i,j})\) 为 \(s \times n\) 的矩阵,定义矩阵 \(A\) 与矩阵 \(B\) 的乘积是一个 \(m \times n\) 的矩阵 \(C = (c_{i,j})\),其中
矩阵的乘法不满足交换律,在进行两个矩阵的相乘时必须要注意运算顺序。
对于矩阵 \(A, B\), 若 \(AB\) 与 \(BA\) 均有意义,则称 \(AB\) 是 \(A\) 左乘 \(B\)(\(B\) 被 \(A\) 左乘)的乘积,\(BA\) 是 \(A\) 右乘 \(B\)(\(B\) 被 \(A\) 右乘)的乘积。
虽然矩阵乘法不满足交换律,但仍然满足下列结合律与分配律:
- \((AB)C=A(BC)\)
- \(\lambda (AB) = (\lambda A)B=A(\lambda B)\)
- \(A(B + C) = AB + AC, (B + C)A = BA + CA\)
矩阵的幂
我们可以利用矩阵乘法定义矩阵的幂:
设 \(A\) 是 \(n\) 阶方阵,定义 \(A^1=A,A^{k+1}=A^kA\ (k\in \Z^+)\),即 \(k\) 个 \(A\) 连乘。
向量的旋转
对于向量 \(\overrightarrow{OP}=\begin{pmatrix}x\\y\end{pmatrix}\),被矩阵 \(A=\begin{bmatrix}\cos\alpha&-\sin\alpha\\\sin\alpha&\cos\alpha\end{bmatrix}\) 左乘等价于将其旋转 \(\alpha\) 角。
证明:
-
考虑向量 \(\overrightarrow{OP}=\begin{pmatrix}1\\0\end{pmatrix}\),左乘 \(A\) 得到:
\[\begin{aligned} \overrightarrow{OP'} &= \begin{bmatrix}\cos\alpha&-\sin\alpha\\\sin\alpha&\cos\alpha\end{bmatrix}\begin{pmatrix}1\\0\end{pmatrix} \\ &= \begin{pmatrix}\cos\alpha\\\sin\alpha \end{pmatrix} \end{aligned} \] -
考虑旋转 \(\alpha\) 之后,再旋转 \(\beta\) 角:
\[\begin{aligned} &\begin{bmatrix}\cos\beta&-\sin\beta\\\sin\beta&\cos\beta\end{bmatrix}\begin{bmatrix}\cos\alpha&-\sin\alpha\\\sin\alpha&\cos\alpha\end{bmatrix}\\ &= \begin{bmatrix}\cos\beta\cos\alpha-\sin\beta\sin\alpha &-\cos\beta\sin\alpha-\sin\beta\cos\alpha\\ \sin\beta\cos\alpha+\cos\beta\sin\alpha& -\sin\beta\sin\alpha+\cos\beta\cos\alpha\end{bmatrix}\\ &=\begin{bmatrix}\cos(\alpha+\beta)&-\sin(\alpha+\beta)\\\sin(\alpha+\beta)&\cos(\alpha+\beta)\end{bmatrix} \end{aligned} \]
即对向量 \(\overrightarrow{OP}\) 左乘 \(B=\begin{bmatrix}\cos\beta&-\sin\beta\\\sin\beta&\cos\beta\end{bmatrix}\),相当于将 \(\begin{pmatrix}1\\0\end{pmatrix}\) 旋转 \(\alpha\) 角至 \(\overrightarrow{OP}\),再旋转 \(\beta\) 角。
矩阵的转置
假设有 \(m \times n\) 的矩阵 \(A\),定义其转置矩阵为其行列交换的 \(n \times m\) 的矩阵,记作 \(A^\top\)。
\(\forall i\in\{1,2,\dots,m\},j\in\{1,2,\dots,n\}\),\(A^\top\) 中的 \((j,i)\) 元等于 \(A\) 中的 \((i,j)\) 元。
写出来就是沿左上
矩阵的转置同样可以看作一种运算,且满足如下性质:
-
\((A^\top)^\top=A\)。
-
\((A+B)^\top = A^\top + B^\top\)。
证:设 \(C=A+B\),则 \(c_{i,j}=a_{i,j}+b_{i,j} \Rightarrow c_{j,i}=a_{j,i}+b_{j,i} \Rightarrow C^\top = A^\top + B^\top\)。
-
\((\lambda A)^\top = \lambda (A^\top)\) 。
证:\((\lambda A)^\top=(\lambda a_{i,j})^\top=(\lambda a_{j,i})=\lambda(a_{j,i})=\lambda A^\top\)。
-
\((AB)^\top=B^\top A^\top\)。
证:设 \(A=(a_{i,j})_{m\times s},B=(b_{i,j})_{s \times n}\),设 \(C=(c_{i,j})_{m\times n}=AB\),则 \(c_{i,j}=\sum_{k=1}^s a_{i,k}b_{k,j}\)。
交换行列,得到 \(c_{j,i}=\sum_{k=1}^s a_{k,i}b_{j,k}\)。
再交换 \(i,j\),得到 \(c_{i,j}=\sum_{k=1}^s b_{i,k}a_{k,j}\),得证。
若方阵 \(A\) 满足 \(A=A^\top\),则称 \(A\) 为对称矩阵,简称对称阵。
矩阵的逆
设 \(A\) 为 \(n\) 阶矩阵,若存在另一个矩阵 \(B\) 使得 \(AB=BA=E\),则称方阵 \(A\) 可逆,并称 \(B\) 是 \(A\) 的逆矩阵,记作 \(A^{-1}\)。
矩阵的逆有以下性质:
-
\(E=E^{-1}\)
-
\((A^{-1})^{-1}=A\)
-
零矩阵不可逆。
-
若 \(A\) 可逆,则 \(A^{-1}\) 唯一。
证:设 \(AB=E,AC=E\),则有 \(B=BE=B(AC)=(BA)C=EC=C\)。
-
若 \(A\) 可逆,则 \(A^\top\) 可逆,且 \((A^\top)^{-1}=(A^{-1})^\top\)。
-
若 \(A,B\) 为同阶方阵且均可逆,则 \(AB\) 亦可逆,且 \((AB)^{-1}=B^{-1}A^{-1}\)。
行列式的定义
设 \(1 \sim n\) 的全排列组成的集合为 \(\pi(n)\),排列 \(P\) 的第 \(i\) 个位置的元素为 \(p_i\),排列 \(P\) 的逆序对数(本文假设标准序列为 \(1,2,\dots,n\))为 \(r(P)\),则定义以下 \(n\) 阶数表:
的行列式为:
,记作
也简记为 \(\det(a_{ij})\)。
(恶臭的写法:\(\large \sum_{P\in \pi(n)}\frac{\prod_{k=1}^n a_{k,p_k}\prod_{1\leq i < j \leq n}(a_i-a_j)}{|\prod_{1\leq i < j \leq n}(a_i-a_j)|}\))
容易发现,对于 \(n\) 阶方阵 \(A\),我们同样可以定义:由 \(A\) 中元素构成的行列式称为 \(A\) 的行列式,记作 \(|A|\) 或 \(\det(A)\)。
注意:
- 只有方阵有行列式,行列式必须是 \(n \times n\) 的数表。
- 方阵是一个矩阵,行列式是一个数。
行列式的性质与运算
表示方法
我们称 \(r_i(i \in\{1,2,\dots,n\})\) 表示第 \(i\) 行, \(c_i(i\in\{1,2,\dots,n\})\) 表示第 \(i\) 列。
基本行列操作
交换行列式的任意两行(列),行列式变号。
交换行列,对于原本的求积顺序来说,会使排列奇偶性改变(证明见行列式的转置-引理 1),因此求和符号内所有符号都要变,因此行列式变号。
交换记作 \(r_i\leftrightarrow r_j\)。
推论:如果存在任意两行(列)元素相同,则该行列式 \(D=0\)。
交换,有 \(D = -D \Rightarrow D=0\)。
对矩阵任意一行(列)乘 \(k\),会使其行列式乘 \(k\)。
求积的时候必然会乘上一个且只会乘上一个该行(列)的数,因此整体放大 \(k\) 倍。
可以利用这一性质来进行化简,例如把公因数提取到行列式外。
另外,由此可以证明 \(|\lambda A|=\lambda^n|A|\)。
推论:如果有两行(列)的元素成比例,则该行列式 \(D=0\)。
提取公因数后两行(列)相同。
行列式的和
设有行列式
则
证:在 \(\prod_{i=1}^n a_{i,p_i}\) 的任意一项中使用乘法分配律即可。
注意到三个行列式同时交换某两行(列)并没有影响,因此这一法则实际上对任意一行(列)的加法都适用。
推论 1:将行列式的任意一行(列)放大 \(k\) 倍加到零一行(列)上,行列式值不变。
相当于加了一个值为零的行列式。
将第 \(i\) 行加上 \(k\) 倍 \(j\) 行记作 \(r_i+kr_j\)(不能套用加法交换律!)。
以上操作被称为初等行变换。
行列式的转置
下证 \(|A^\top|=|A|\)。
引理 1:交换任意排列的任意两个数,该排列奇偶性改变。
证:
- 首先考虑交换相邻的两个数,那么这两个数与其它数的相对关系不会发生改变,仅这两个数产生逆序或逆序消失,排列奇偶性改变。
- 假设交换的两个数为 \(p_i,p_j(1\le i < j \le n)\),我们可以看作是先交换 \(p_i,p_{i+1}\),再交换 \(p_{i+1},p_{i+2}\),直到交换 \(p_{j-1},p_j\),然后再回过头交换 \(p_{j-1},p_{j-2}\),直到交换 \(p_{i+1},p_i\),一共交换了 \(2(j - i) - 1\) 次。由于操作次数为奇数,因此排列的奇偶性改变。
推论:奇排列变为标准排列需要交换奇数次,偶排列则需要偶数次。
易证。
引理 2:定义排列 \(q_i\) 为满足 \(p_{q_i}=i\) 的排列 \(q\),则有 \(q\) 与 \(p\) 一一对应,且 \(r(q)=r(p)\)。
证:
-
由于排列中每个数仅出现一次,所以进行一次上述构造操作(以下称“逆置换”)得到的序列唯一。
若我们将 \(p\) 的下标和值互换,得到的序列满足 \(q\) 的定义,因此对 \(p\) 进行一次逆置换相当于交换 \(p\) 的值和下标。
那么交换两次得到的将是原序列,所以 \(p\) 唯一对应 \(q\),\(q\) 也唯一对应 \(p\)。
推论:\(q_{p_i}=i\)
-
首先我们不妨设 \(q=1,2,\dots,n\),将 \(p_i\) 写作 \(p_{q_i}\),则我们对 \(p\) 进行排序后进行一次逆置换即可得到 \(q\)。
设将 \(p\) 变为标准序列至少需要 \(k\) 次交换,\(p\) 变为有序的同时,下标也变为了序列 \(q\),那么 \(q\) 也进行了 \(k\) 次交换,即 \(p\) 变为 \(1,\dots,n\) 需要 \(k\) 次交换,\(1,\dots,n\) 变为 \(q\) 也要 \(k\) 次交换,则 \(p\) 变为 \(q\) 需要 \(2k\) 次交换,因此奇偶性不变。
定理 1:以下定义与行列式的定义等价:
\[D=\sum_{P \in \pi(n)}(-1)^{r(P)} \prod_{i=1}^n a_{p_i,i} \]
证:
考虑将 \(p\) 用逆置换 \(q\) 来表示:
第一步使用的是引理 2 推论,第二步利用了 \(p\) 与 \(q\) 一一对应,第三步用的是 \(r(P)=r(Q)\),第四步是因为我们并不关心 \(p\) 的求积顺序,因为对于一个确定的 \(Q\),它的 \(P\) 一定是唯一的,本质上也是利用了一一对应。
由于转置可以将列转化为行,因此下文中除特别强调,否则行可以的操作列也可以。
上三角行列式与下三角行列式
对于下三角行列式,我们可以较为简单的求出其值,为其对角线之积:
证:下三角行列式中,纵坐标永远小于等于横坐标,因此有 \(\forall i \in\{1,2,\dots,n\}, p_i \le i\),满足该性质的排列有且仅有 \(1,2,\dots,n\)。
上三角矩阵可转置为下三角矩阵,因此也满足该性质。
利用初等行变换可以将任意行列式转化为上三角行列式或下三角行列式,即高斯消元。
高斯消元法将行列式化为下三角行列式分为以下步骤:
- 对于前 \(1 \sim n-1\) 行,设当前考虑到第 \(k\) 行,我们利用初等行变换将 \(a_{k,n}\) 变为 \(0\),即进行 \(r_k-\frac{a_{k,n}}{a_{n,n}}r_n\),最终会将整个第 \(n\) 列除 \(a_{n,n}\) 以外全部化为 \(0\)。
- 之后仅需将左上角的 \(n-1\) 阶方阵化为下三角矩阵,重复以上步骤。
行列式相乘
设有行列式 \(A=(a_{i,j})_m,B=(b_{i,j})_n\),他们的积为 \(D\),则有:
其中 \(c_{i,j}\) 为任意数。
证:仅对前 \(1 \sim m\) 行做初等行变换,相当于将 \(A\) 化为下三角矩阵。同理也可将 \(B\) 化为下三角矩阵,两部分互不影响,同时将 \(D\) 化为了下三角矩阵。
设有 \(n\) 阶方阵 \(A,B\),则有运算律:\(|AB|=|A||B|\)。
证:构造如下的 \(2n \times 2n\) 的方阵:
对该行列式进行如下的变换:\(c_{n+i}=\sum_{k=1}^n b_{k,i}c_i\),原行列式变为 \(D=\begin{vmatrix}A&M\\-E&O\end{vmatrix}\),其中 \(m_{i,j}=\sum_{k=1}^na_{i,k}b_{k,j}\),即\(M=AB\)。
再进行 \(n\) 次交换,使其变为 \(\begin{vmatrix}M&A\\O&-E\end{vmatrix}=(-1)^nD\)。
而该行列式的值同时等于 \(|M||-E|=(-1)^n|M||E|\),两边约掉得到 \(|AB|=|M|=D=|A||B|\),证毕。
子式,余子式与代数余子式
定义与性质
在 \(n\) 阶行列式中,把 \((i,j)\) 元 \(a_{i,j}\) 所在的第 \(i\) 行和第 \(j\) 列划去后,留下的 \(n-1\) 阶行列式被称作 \((i,j)\) 元 \(a_{i,j}\) 的余子式,记作 \(M_{i,j}\)。
记 \(A_{i,j}=(-1)^{i+j}M_{i,j}\) 为其代数余子式。
引理:对于一个 \(n\) 阶行列式,如果第 \(i\) 行除 \(a_{i,j}\) 外的元素均为 \(0\),那么有 \(D=a_{i,j}A_{i,j}\)。
证:
-
首先考虑当 \((1,1)\) 不为 \(0\) 的时候,则若选中第一行的 \(2 \sim n\) 元素,对结果的贡献必然为零。若选中 \(a_{1,1}\),则之后不会再选第一列。
因此只需考虑右下角的 \(n-1\) 阶行列式。由于 \((1,1)\) 不会与任何值产生逆序,因此不会对正负性产生影响。
-
考虑 \((i,j)\) 元不为 \(0\) 的情况,可以先将其与 \((i-1,j)\) 交换,再与 \((i-2,j)\) 交换,直到进行 \(i-1\) 次交换将其移动到第一行。同理进行 \(j-1\) 次交换将其移动到第一列。那么一共交换了 \(i + j - 2\) 次,行列式变为 \((-1)^{i+j-2}D=(-1)^{i+j}D\),与代数余子式的定义相吻合。
定理 2(行列式按行(列)展开法则):行列式等于它的任意一行的各元素与其对应的代数余子式乘积之和。
考虑其代数余子式,相当于假设它这一行列除本身外全部为零。由引理与行列式的性质易证。
推论:行列式_某一行的元素_与_另一行的对应元素的代数余子式_的乘积之和等于零,即:
\(\forall i\neq j\in\{1,2,\dots,n\},\sum_{k=1}^n a_{i,k}A_{j,k}=0\)
证:由定理 2,我们知道 \(D=\sum_{k=1}^n a_{j,k}A_{j,k}\),则 \(\sum_{k=1}^n a_{i,k}A_{j,k}\) 等价于 \(r_j=r_i\),而这样的行列式等于零。
也因此,我们推导出有关于代数余子式的重要性质:
伴随矩阵
设有 \(n\) 阶矩阵 \(A\),定义行列式 \(|A|\) 的伴随矩阵为其中_每一个元素的代数余子式_在_对应位置_组成的矩阵的转置,记为 \(A^*\)。
即:
伴随矩阵满足以下性质:
- \(A\) 可逆当且仅当 \(A^*\) 可逆。
- 若 \(A\) 可逆,则 \(A^*=|A|A^{-1}\)。
- 若 \(A\) 可逆,则 \((A^{-1})^*=(A^*)^{-1}\)。
- \(|A^*|=|A|^{n-1}\)。
- \((kA)^*=k^{n-1}A^*\)。
- \((A^\top)^*=(A^*)^\top\)。
- \((AB)^*=B^*A^*\)。
- \(AA^*=A^*A=|A|E\)。
克拉默法则
设有线性方程组 \(A \overrightarrow X= \overrightarrow B\),其中 \(A\) 为 \(n \times n\) 的系数矩阵, \(B\) 为 \(n \times 1\) 的常数矩阵,若 \(|A|=D \neq 0\),那么该方程有唯一解\(x_i=\frac{D_i}{D}\),其中 \(D_i\) 为将 \(D\) 中第 \(j\) 列替换成 \(B\) 所得的行列式,由定理 2 可知 \(D_i=\sum_{k=1}^n b_kA_{k,i}\)。
证:
由于 \(|D|\neq0\),因此可以通过高斯消元法将 \(A\) 化为下三角矩阵求解。
考虑写出增广矩阵(即 \(A|b\) ),并且化为行阶梯矩阵:
考虑 \((1,1)\) 元:化简后不难看出 \(b'_1=x_1a'_{1,1}\),可以解得
而对于其它的 \(x_i (i\ge2)\),我们不妨进行操作 \(c_1\leftrightarrow c_i\),这样就使 \(x_1\) 和 \(x_i\) 交换了位置。此时,\(D_i\) 和 \(D\) 均变号,解为 \(x_i=\frac{-D_i}{-D}=\frac{D_i}{D}\)。
向量、向量组与线性相关
由若干个同维数的向量组成的集合叫做向量组。因此,一个 \(m \times n\) 的矩阵可以看作 \(n\) 个 \(m\) 维列向量组成的向量组,也可以看做 \(m\) 个 \(n\) 维行向量组成的向量组。
对于给定的一个向量组 \(A:a_1,a_2,\dots,a_n\),则对于任意一组实数 \(\lambda_1,\lambda_2,\dots,\lambda_n\),称 \(\sum_{i=1}^n \lambda_ia_i\) 为 \(A\) 的一个线性组合。\(A\) 的所有线性组合组成的集合被称作 \(A\) 的张成(span)。
若 \(A\) 满足:\(\forall a \in A, a \notin \text{Span}(A \setminus a)\),则称 \(A\) 线性相关,否则称其线性无关。
即不存在不全为 0 的实数组满足 \(\sum a_i\lambda_i=0\)。
矩阵的秩,初等变换
秩分为列秩和行秩,是矩阵的线性无关的纵列/横行的极大数目。
咕咕咕