高等代數1 矩陣

矩陣的基本運算
矩陣概念
由\(sn\)個數排成的\(s\)行(橫的)\(n\)列(縱的)表
稱為一個\(s \times n\)矩陣。
相等
只有完全一樣的矩陣才相等。
加法
為了確定起見,我們取定一個數域\(P\),以下討論的矩陣全是由數域\(P\)中的數組成的。
矩陣的加法就是矩陣對應的元素相加。相加的矩陣必須有相同的行數和列數。
矩陣的加法歸結為他們的元素的加法。
結合律
\(A+(B+C)=(A+B)+C\)
交換律
\(A+B=B+A\)
零矩陣
元素全為零的矩陣稱為零矩陣,記為\(O\)。
顯然有,\(A+O=A\)
減法
負矩陣
矩陣\(A\)的負矩陣記為\(-A\), 有\(A+(-A)=O\)
減法:\(A-B=A+(-B)\)
轉置
把一矩陣\(A\)的行列互換,得到的矩陣稱為\(A\)的轉置,記為\(A'(A^T)\)。
轉置有以下規律
共軛矩陣
當\(A=(a_{ij})\)為復矩陣時,用\(\bar{a}\)表示\(a\)的共軛復數,記\(\bar{A}=(\bar{a_{ji}})\),即把矩陣轉置后在把每個數換成它的共軛復數。\(\bar{A}\)為\(A\)的共軛矩陣。
Hermite矩陣(自共軛矩陣)
其相對於主對角線以復共軛方式對稱。

顯然,Hermite陣主對角線上的元素必須是實數。對於只包含實數元素的矩陣(實矩陣),如果它是對稱陣,即所有元素關於主對角線對稱,那么它也是Hermite陣。也就是說,實對稱陣是Hermite陣的特例
數量乘法
用數\(k\)乘矩陣就是把矩陣的每一個元素都乘以\(k\)。
矩陣的數量乘積有以下規律
數量矩陣
矩陣\(kE\)稱為數量矩陣。
如果\(A\)是一個\(n\times n\)的矩陣,那么有 \(kA=(kE)A=A(kE)\),這個式子說明數量矩陣與所有的\(n \times n\)矩陣作乘法是可交換的。
可以證明,如果\(A\)與所有的\(n\)級矩陣可交換,那么\(A\)一定是數量矩陣,即\(A=aE\)。
對稱矩陣、反稱矩陣
對稱矩陣: 如果\(A'=A\),矩陣\(A\)稱為對稱的。
反稱矩陣:如果\(A'=-A\),矩陣\(A\)稱為反稱的。
任一\(n\times n\)矩陣都可以表示為一對稱矩陣和一反稱矩陣之和。

矩陣相乘
設 \(A=(a_{ik})_{sn},B=(b_{kj})_{nm}\),那么矩陣\(C=(c_{ij})_{sm}\),其中\(c_{ij}=a_{i1}b_{1j}+a_{i2}b_{2j}+\cdots++a_{in}b_{nj}= \sum_{k=1}^{n}a_{ik}b_{kj}\)
稱為\(A\)與\(B\)的乘積,記為\(C=AB\)。
矩陣\(A,B\)乘積\(C\)的第\(i\)行第\(j\)列的元素等於第一個矩陣\(A\)的第\(i\)行與第二個矩陣\(B\)的第\(j\)列的對應元素乘積的和。
當然在矩陣乘積定義中我們要求第二個矩陣的行數和第一個矩陣的列數相等。
單位矩陣
主對角線上的元素都是\(1\),其余元素都是\(0\)的\(n\times n\)矩陣稱為\(n\)級單位矩陣,記作\(E_n\),或簡單記為\(E\)
顯然有
\(A_{sn}E_{n}=A_{sn}\)
\(E_{n}A_{sn}=A_{sn}\)
結合律
設\(A=(a_{ij})_{sn},B=(b_{jk})_{nm},C=(c_{kl})_{mr}\)
\((AB)C=A(BC)\)
不適合交換律
矩陣的乘法不適合交換律,即一般來說\(AB\neq BA\).
兩個不為零的矩陣的乘積可以是零。
矩陣乘法的消去律不成立。
可交換矩陣
如果\(AB=BA\),矩陣\(B\)就稱為與\(A\)可交換。
乘法和加法的分配律
矩陣的方冪
方冪只能對行數和列數相等的矩陣定義
設\(A\)是一\(n\times n\)矩陣,定義\(A^1=A,A^{k+1}=A^k A\),話句話說\(A^k\)就是\(k\)個\(A\)相乘。
由乘法的結合律有,\(A^k A^l=A^{k+l} \\ (A^k)^l=A^{kl}\)
矩陣的逆
\(n\)級方陣\(A\)稱為可逆的,如果有\(n\)級矩方陣\(B\),使得
這里的\(E\)指的是單位矩陣。
-
由於矩陣的乘法規則,只有方陣才能滿足(4)
-
對於任意矩陣\(A\),適合等式(4)的矩陣\(B\)是唯一的(如果有的話)。
如果矩陣\(B\)適合(4),那么\(B\)就稱為\(A\)的逆矩陣,記作\(A^{-1}\).
對於\(n\)級方陣\(A,B\),如果\(AB=E\),那么\(A,B\)就都是可逆的並且它們互為逆矩陣。
矩陣可逆條件
- 伴隨矩陣
設矩陣\(A_{ij}\)是矩陣
中元素\(a_{ij}\)的代數余子式,矩陣
稱為\(A\)的伴隨矩陣。‘
由行列式按一行(列)展開的公式立即得出
如果\(d=|A| \neq 0\),那么由(7)得
- 定理
矩陣\(A\)是可逆的充分必要條件是\(A\)非退化,而\(A^{-1}=\frac{1}{d} A^{*} (d=|A|\neq 0)\)。
推論
如果矩陣\(A、B\)可逆,那么\(A'\)與\(AB\)也可逆,且
$(A'){-1}=(A{-1})' \(AB){-1}=B{-1}A^{-1} $
矩陣初等變換

初等行變換
數域\(P\)上矩陣的初等行變換是指下面三種變換:
-
以\(P\)中一個非零的數乘矩陣的某一行;
-
把矩陣的某一行的\(c\)倍加到另一行,這里的\(c\)是\(P\)中任意一個數;
-
互換矩陣中兩行的位置。
任意一個矩陣經過一系列初等行變換總能變成階梯形矩陣
初等列變換
- 以數域\(P\)中一非零數乘矩陣的某一列;
- 把矩陣的某一列的\(c\)倍加到另一列,這里\(c\)是數域\(P\)中任意一個數;
- 互換矩陣兩列的位置。
初等變換
矩陣的初等行變換與列變換統稱為初等變換。
初等矩陣
由單位矩陣\(E\)經過一次初等變換得到的矩陣稱為初等矩陣。
顯然初等矩陣都是方陣。每一個初等變換都有一個相應的初等矩陣。
- 互換矩陣的\(i\)行與\(j\)行的位置;
- 用數據\(P\)的非零數\(c\)乘\(E\)的\(i\)行;
- 把矩陣\(E\)的\(k\)倍加到\(i\)行;
- 同樣可以得到與列變換相應的初等矩陣。
初等矩陣都是可逆的,他們的逆矩陣還是初等矩陣。
- 引理:
對一個\(s \times n\)矩陣\(A\)作一初等行變換就相當於在\(A\)的左邊乘上相應的$s \times $初等s矩陣,
對\(A\)作一初等列變換就相當於在\(A\)的右邊乘上相應的\(n \times n\)的初等矩陣
等價
矩陣\(A\)和\(B\)稱為等價的,如果\(B\)可以由\(A\)經過一系列初等變換得到
等價是矩陣間的一種關系。不難證明,它具有自反性、對稱性、傳遞性。
階梯形矩陣
我們把形式如
的矩陣稱為階梯形矩陣。它們的任一行從第一個元素起至該行的第一個非零元素所在的下方全為零。如果該行為零,則它的下面的行也全為零。
任意一個矩陣經過一系列初等行變換總能變成階梯形矩陣。
標准形
- 定理
任意一個\(s \times n\)矩陣\(A\)都與一形式為
的矩陣等價,它稱為矩陣的標准形,主對角線上1的個數等於矩陣\(A\)的秩(1的個數可以是零)。
等價判定
根據引理,對矩陣作初等變換就相當於用相應的初等矩陣去乘這個矩陣。
- 矩陣\(A,B\)等價的充分必要條件是有初等矩陣\(P_1,\cdots ,P_l ,Q_1 ,\cdots ,Q_t\)使
矩陣初等變換與逆矩陣
\(n\)級可逆矩陣的秩為\(n\),所以可逆矩陣的標准形為單位矩陣;反過來也是對的。
- 定理 \(n\)級可逆矩陣\(A\)為可逆的充分必要條件是它能表示為一些初等矩陣的乘積
-
推論1 兩個\(s \times n\)矩陣\(A、B\)等價的充分必要條件為,存在可逆的\(s\)級矩陣\(P\)與可逆的\(n\)級矩陣\(Q\),使\(A=PBQ\)
-
推論2 可逆矩陣總可以經過一系列初等行變換化為單位矩陣。
求逆矩陣的方法
設\(A\)是一個\(n\)級可逆矩陣。由推論2,有一系列矩陣\(P_1,\cdots ,P_m\)使
由上式得
上述兩個式子說明,如果用一系列初等行變換把可逆矩陣\(A\)化為單位矩陣,那么同樣地用這一系列初等行變換去化單位矩陣就能得到\(A^{-1}\)。
把\(A,E\)這兩個\(n \times n\)矩陣放在一起,作為一個\(n \times 2n\)矩陣 \((A,E)\),按矩陣的分塊乘法把(12),(13)合並有
(15)式提供了一個具體求逆矩陣的方法。
作\(n \times 2n\)矩陣\((A,E)\)用初等行變換把它的左邊一半化為\(E\),這時,右邊的一半就是\(A^{-1}\)。
矩陣的秩
-
行秩、列秩
矩陣的行秩就是指矩陣的行向量組的秩,矩陣的列秩就是矩陣的列向量組的秩
-
定理
矩陣的行秩與列秩相等。所以統稱為矩陣的秩
秩與行列式的關系
-
子式
在一個\(s \times n\)矩陣\(A\)中任意選定\(k\)行和\(k\)列,位於這些選定的行和列的交點上的\(k^2\)個元素按着原來的次序所組成的\(k\)級行列式,稱為\(A\)的一個\(k\)級子式。當然有\(k \leq min(s,n)\)
-
定理
一矩陣的秩是\(r\)的充分必要條件為矩陣中有一個\(r\)級子式不為零,同時所有\(r+1\)級子式全為零。
-
定理
\(n \times n\)矩陣
\[A=\left ( \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots &\ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right ) \]的行列式為零的充分必要條件是\(A\)的秩小於\(n\)。
計算矩陣的秩
首先,矩陣的初等行變換是把行向量變成一個與之等價的向量組。等價的向量組有相同的秩,因此,初等行變換不改變矩陣的秩。同樣,初等列變換也不改變矩陣的秩。
其次,階梯形矩陣的秩就等於其中非零行的數目。
為了計算一個矩陣的秩,只要用初等行變換把它變成階梯形矩陣,這個階梯形矩陣中非零行的個數就是原來矩陣的秩。
矩陣加法的秩
\(秩(A+B)\leq 秩(A)+秩(B)\)
矩陣乘積的秩
-
定理
設\(A\)是數域\(P\)上$n \times \(m矩陣,\)B\(是數域\)P\(上\)m \times s$矩陣,於是
\[秩(AB) \leq min[秩(A),秩(B)] \]即乘積的秩不超過各因子的秩。
-
推論 用數學歸納法可以推廣到多個因子的情形,
如果\(A=A_1A_2\cdots A_t\),那么\(秩(A) \leq \min_{1 \leq j \leq t}秩(A_j)\)
矩陣與行列式
矩陣的行列式
對於\(n\)級方陣
其行列式為
行列式的計算
一個\(n\)階行列式可以看成由一個\(n\)級方陣\(A\)決定的,對於矩陣可以進行初等行變換變為階梯形方陣,階梯形方陣的行列式是上三角形的,也就等於對角線元素的乘積。
行列式的性質
- 一個數乘行列式的一行等於用這個數乘這個行列式,或說 一行的公因子可以提出去。
- 把一行的倍數加到另一行,行列式不變。
- 對換行列式中兩行的位置,行列式反號。
由行列式的性質可以得知方陣進行初等行變換對行列式的值影響。
乘積的行列式
-
定理
設\(A,B\)是數域\(P\)上的兩個\(n \times n\)矩陣,那么
即矩陣乘積的行列式等於它的因子的行列式的乘積。
- 推論1 推廣到多個因子的情形
設\(A_1,A_2,\cdots ,A_m\)都是數域\(P\)上的\(n \times n\)矩陣,於是\(|A_1A_2\cdots A_m|=|A_1||A_2|\cdots|A_m|\)
非退化矩陣
數域\(P\)上的\(n \times n\)矩陣\(A\)稱為非退化的,如果\(|A| \neq 0\);否則稱為退化的。
-
推論2
設\(A、B\)是數域\(P\)上\(n \times n\)矩陣,矩陣\(AB\)為退化的充分必要條件是\(A、B\)中至少有一個是退化的。
矩陣的分塊
把一個大矩陣看作是由一些小矩陣組成的,就如矩陣是由數組成的。特別在運算中,把這些小矩陣當做數來處理。這就是矩陣的分塊
分塊方法
-
把矩陣按塊分。
設\(A=(a_{ik})_{sn},B=(b_{kj})_{nm}\),把\(A,B\)分成一些小矩陣其中各個\(A_{ij}\)是\(s_i \times n_j\)小矩陣,\(B_{ij}\)是\(n_i \times m_j\)小矩陣.
注意矩陣\(A\)的列的分法必須與矩陣\(B\)的行的分法一致。
-
把矩陣按行或列分 。可以看出\(AB\)的行向量是\(B\)的行向量的線性組合,\(AB\)的列向量是\(A\)的列向量的線性組合。
對角矩陣
對角矩陣 形式為
的矩陣,其中\(a_i\)是數\((i=1,2,\cdots,l)\),通常稱為對角矩陣。
**准對角矩陣 **形式為
的矩陣,其中\(A_i\)是\(n_i \times n_i\)矩陣\((i=1,2,\cdots,l)\),通常稱為准對角矩陣。
上(下)三角形矩陣
上三角形 矩陣\(A=(a_{ij})\)稱為上三角形矩陣,如果\(i>j\)時有\(a_{ij}=0\)
下三角形 矩陣\(A=(a_{ij})\)稱為下三角形矩陣,如果\(i<j\)時有\(a_{ij}=0\)
兩個上(下)三角形矩陣的乘積仍然是上(下)三角形矩陣。
證明:



可逆的上(下)三角形矩陣的逆仍是上(下)三角形矩陣。



分塊乘法的初等變換
將單位矩陣進行分塊
對它進行
-
兩行(列)對換,得到
\[\left ( \begin{matrix} O &E_m \\ E_n &O \end{matrix} \right ) \] -
某一行(列)左乘(右乘)一個矩陣\(P\),得到
\[\left ( \begin{matrix} P &O \\ O &E_n \end{matrix} \right ) , \left ( \begin{matrix} E_m &O \\ O &P \end{matrix} \right ) \] -
一行(列)加上另一行(列)的\(P\)(矩陣)倍數
\[\left ( \begin{matrix} E_m &P \\ O &E_n \end{matrix} \right ) , \left ( \begin{matrix} E_m &O \\ P &E_n \end{matrix} \right ) \]
和初等矩陣與初等變換的關系一樣,用這些矩陣左乘任何一個分塊矩陣,只要分塊乘法能夠進行,其結果就是對它進行相應的變換
-
\[\left ( \begin{matrix} O &E_m \\ E_n &O \end{matrix} \right ) \left ( \begin{matrix} A &B \\ C &D \end{matrix} \right ) = \left ( \begin{matrix} C &D \\ A &B \end{matrix} \right ) \]
-
\[\left ( \begin{matrix} P &O \\ O &E_n \end{matrix} \right ) \left ( \begin{matrix} A &B \\ C &D \end{matrix} \right ) = \left ( \begin{matrix} PA &PB \\ C &D \end{matrix} \right ) \]
-
\[\left ( \begin{matrix} E_m &O \\ P &E_n \end{matrix} \right ) \left ( \begin{matrix} A &B \\ C &D \end{matrix} \right ) = \left ( \begin{matrix} A &B \\ C+PA &D+PB \end{matrix} \right ) \]
可以適當選擇\(P\),使得\(C+PA=O\),例如當\(A\)可逆時,選\(P=-CA^{-1}\),則\(C+PA=O\)
應用舉例——求逆矩陣
求
的逆矩陣,其中\(A,B\)分別是\(k\)級和\(r\)級的可逆矩陣,\(C\)是\(r \times k\)矩陣,\(O\)是\(k \times r\)零矩陣。
首先 \(|D|=|A||B|\),所以當\(A,B\)可逆時,\(D\)也可逆。
-
方法1,分塊矩陣乘法
設
\[D=\left ( \begin{matrix} X_{11} &X_{12}\\ X_{21} &X_{22} \end{matrix} \right ) \]於是
\[\left ( \begin{matrix} A &O \\ C &B \end{matrix} \right ) \left ( \begin{matrix} X_{11} &X_{12} \\ X_{21} &X_{22} \end{matrix} \right ) = \left ( \begin{matrix} E_{k} &O \\ O &E_{r} \end{matrix} \right ) \]這里的\(E_k,E_r\)分別表示\(k\)級和\(r\)級單位矩陣,乘出並比較等式兩邊,得
\[\begin{cases} AX_{11}=E_{k} \\ AX_{12}=O \\ CX_{11}+BX_{21}=O \\ CX_{12}+BX_{22}=E_{r} \\ \end{cases} \]解得
\[\begin{cases} X_{11}=A^{-1} \\ X_{12}=O \\ X_{21}=-B^{-1}CA^{-1} \\ X_{22}=B^{-1} \\ \end{cases} \]因此
\[D^{-1}= \left ( \begin{matrix} A^{-1} &O\\ -B^{-1}CA^{-1} &B^{-1} \end{matrix} \right ) \]特別地,當\(C=O\)時,有
\[\left ( \begin{matrix} A &O \\ O &B \end{matrix} \right ) ^{-1} = \left ( \begin{matrix} A^{-1} &O \\ O &B^{-1} \end{matrix} \right ) \] -
方法2, 初等變換
由(31)式有
\[\left ( \begin{matrix} E_m &O \\ -CA^{-1} &E_n \end{matrix} \right ) \left ( \begin{matrix} A &O \\ C &B \end{matrix} \right ) = \left ( \begin{matrix} A &O \\ O &B \end{matrix} \right ) \]及
\[\left ( \begin{matrix} A &O \\ O &B \end{matrix} \right ) ^{-1} = \left ( \begin{matrix} A^{-1} &O \\ O &B^{-1} \end{matrix} \right ) \]易知
\[D^{-1} = \left ( \begin{matrix} A^{-1} &O \\ O &B^{-1} \end{matrix} \right ) \left ( \begin{matrix} E_m &O \\ -CA^{-1} &E_n \end{matrix} \right ) =\left ( \begin{matrix} A^{-1} &O\\ -B^{-1}CA^{-1} &B^{-1} \end{matrix} \right ) \]
矩陣與線性方程組的求解
齊次線性方程組
判斷有無非零解
-
方程個數
在齊次線性方程組
\[\begin{cases} a_{11}x_1 +a_{12}x_2+\cdots +a_{1n}x_n=0 \\ a_{21}x_1 +a_{22}x_2+\cdots +a_{2n}x_n=0 \\ \ \ \ \cdots \cdots \\ a_{s1}x_1 +a_{s2}x_2+\cdots +a_{sn}x_n=0 \\ \end{cases} \]中,如果\(s<n\)(方程個數<未知數個數),那么他必有非零解。
-
系數矩陣的秩
齊次線性方程組
-
的系數矩陣
的行秩\(r<n\),那么它有非零解。
-
系數矩陣的行列式
齊線性方程組
有非零解的充分必要條件是它的系數矩陣
的行列式等於零。
性質
- 兩個解的和還是方程組的解。
- 一個解的倍數還是方程組的解。
解的線性組合還是方程組的解。
基礎解系
齊次線性方程組(6)的一組解\(\eta_1,\eta_2,\cdots,\eta_t\)稱為(6)的一個基礎解系,如果
- (6)的任意一個解都能表示成\(\eta_1,\eta_2,\cdots,\eta_t\)的線性組合;
- \(\eta_1,\eta_2,\cdots,\eta_t\)線性無關
具體找基礎解系的方法
-
定理
在齊次線性方程組有非零解的情況下,它有基礎解系,並且基礎解系所含解的個數等於\(n-r\),這里\(r\)表示系數矩陣的秩(\(n-r\)也就是自由未知量的個數)。
任何一個線性無關的與某一個基礎解系等價的向量組都是基礎解系。
設方程組的系數矩陣的秩為\(r\),方程組可以改寫為
-
如果\(r=n\),方程組沒有自由未知量,方程組右端為零,方程組只有零解。
-
分別用\(n-r\)組數\((1,0,\cdots,0),(0,1,\cdots,0),\cdots,(0,0,\cdots,1)\)來代替自由未知量\((x_{r+1},x_{r+2},\cdots,x_n)\),就得出方程組的\(n-r\)個解
\[\begin{cases} \eta_1=(c_{11},\cdots,c_{1r},1,0,\cdots,0) \\ \eta_2=(c_{21},\cdots,c_{2r},0,1,\cdots,0) \\ \ \ \ \cdots \cdots \\ \eta_{n-r}=(c_{n-r,1},\cdots,c_{n-r,r},0,0,\cdots,1) \\ \end{cases} \]上式就是一個基礎解系,方程的任意一個解都可以由它表示出來。
一般線性方程組
矩陣
稱為系數矩陣。
矩陣
稱為增廣矩陣。
有解的判別
- 線性方程組(1)有解的充分必要條件是它的系數矩陣\(A\)和增廣矩陣\(\bar A\)有相同的秩。
-
用初等行變換將增廣矩陣化為階梯形矩陣。
-
如果系數矩陣與增廣矩陣有相同的秩,方程組有解;
- 當增廣矩陣的秩等於未知數個數時,方程組有唯一解;
- 當增廣矩陣的秩小於未知數個數時,方程有無窮多個解。
-
當增廣矩陣的秩等於系數矩陣的秩加1時,方程組無解。
-
解的結構 導出組
- 導出組:把一般線性方程組
\[\begin{cases} a_{11}x_1 +a_{12}x_1+\cdots +a_{1n}x_1=b_1 \\ a_{21}x_1 +a_{22}x_1+\cdots +a_{2n}x_1=b_2 \\ \ \ \ \cdots \cdots \\ a_{s1}x_1 +a_{s2}x_1+\cdots +a_{sn}x_n=b_s \\ \end{cases} \]的常數項換為\(0\),就得到齊次線性方程組,\[\begin{cases} a_{11}x_1 +a_{12}x_1+\cdots +a_{1n}x_1=0 \\ a_{21}x_1 +a_{22}x_1+\cdots +a_{2n}x_1=0 \\ \ \ \ \cdots \cdots \\ a_{s1}x_1 +a_{s2}x_1+\cdots +a_{sn}x_n=0 \\ \end{cases} \]所得到的齊次線性方程組(17)稱為原一般線性方程組(16)的導出組。
原一般線性方程組和它的導出組的解之間的關系
- 線性方程組(15)的兩個解的差是它的導出組(16)的解。
- 線性方程組(15)的一個解與它的導出組(16)的一個解之和還是這個線性方程組的一個解。
-
定理
如果\(\gamma_0\)是方程組(15)一個特解,那么方程組(15)的任何一個解\(\gamma\)都可以表成
\[\gamma=\gamma_0+\eta \]其中\(\eta\)是導出組(16)的一個解。
因此,對於方程組(15)的任一個特解\(\gamma_0\),當\(\eta\)取遍它的導出組的全部解時,(17)就給出(15)的全部解。
-
如果\(\gamma_0\)是方程組(15)的一個特解,\(\eta_1,\eta_2,\cdots,\eta_s\)是其導出組的一個基礎解系,那么(15)的任一個解\(\gamma\)都可以表成
\[\gamma=\gamma_0+k_1\eta_1+k_2\eta_2+\cdots+k_{n-r}\eta_{n-r} \] -
推論 在方程組(15)有解的條件下,解是唯一的充分必要條件是它的導出組(1)只有零解。
矩陣與二次型

二次型及其矩陣表示
- 設\(P\)是一數域,一個系數在數域\(P\)中的\(x_1,x_2,\cdots,x_n\)的二次齊次多項式
稱為數域\(P\)上一個\(n\)元二次型,或簡稱為二次型。
- 把(1)的系數排成一個\(n \times n\)矩陣
它就稱為二次型(1)的矩陣。
因為\(a_{ij}=a_{ji},i,j=1,\cdots,n\),所以,\(A'=A\)。因此二次型的矩陣都是對稱的。
- 令
\[X=\left ( \begin{matrix} x_1 \\ x_2 \\ \vdots \\ x_n \\ \end{matrix} \right ) \]於是二次型可以用矩陣的乘積表示出來\[X'AX=(x_1,x_2,\cdots,x_n)\left ( \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right )\left ( \begin{matrix} x_1 \\ x_2 \\ \vdots \\ x_n \\ \end{matrix} \right )=f(x_1,x_2,\cdots,x_n) \]
二次型和它的矩陣是相互唯一決定的。
線性替換及其矩陣表示
-
線性替換 設\(x_1,\cdots,x_n;y_1,\cdots,y_n\)是兩組文字,系數在數域\(P\)中的一組關系式
\[\begin{cases} x_1=c_{11}y_1 +c_{12}y_2+\cdots +c_{1n}y_n \\ x_2=c_{21}y_1 +c_{22}y_2+\cdots +c_{2n}y_n\\ \ \ \ \cdots \cdots \\ x_n=c_{n1}y_1 +c_{n2}y_2+\cdots +c_{nn}y_n \\ \end{cases} \]稱為由\(x_1,\cdots,x_n\)到\(y_1,\cdots,y_n\)的一個線性替換。
如果系數行列式\(|c_{ij}|\neq 0\),那么線性替換(5)就稱為非退化的。
線性替換把二次型變成二次型。
-
令
\[C=\left ( \begin{matrix} c_{11} & c_{12} & \cdots & c_{1n} \\ c_{21} & c_{22} & \cdots & c_{2n} \\ \vdots & \vdots & & \vdots \\ c_{n1} & c_{n2} & \cdots & c_{nn} \\ \end{matrix} \right ), Y= \left ( \begin{matrix} y_1 \\ y_2 \\ \vdots \\ y_n \\ \end{matrix} \right ) \]線性替換可以寫成
\[\left ( \begin{matrix} x_1 \\ x_2 \\ \vdots \\ x_n \\ \end{matrix} \right ) = \left ( \begin{matrix} c_{11} & c_{12} & \cdots & c_{1n} \\ c_{21} & c_{22} & \cdots & c_{2n} \\ \vdots & \vdots & & \vdots \\ c_{n1} & c_{n2} & \cdots & c_{nn} \\ \end{matrix} \right ) \left ( \begin{matrix} y_1 \\ y_2 \\ \vdots \\ y_n \\ \end{matrix} \right ) \]或者 \(X=CY\)
-
替換后的二次型的矩陣與原二次型的矩陣之間的關系
\[f(x_1,x_2,\cdots,x_n)=X'AX=(CY)'A(CY)=Y'(C'AC)Y=Y'BY \]因此 \(B=C'AC\)
合同變換
-
定義 數域\(P\)上\(n \times n\)矩陣\(A,B\)稱為合同的,如果有數域\(P\)上可逆的\(n \times n\)矩陣\(C\),使 \(B=C'AC\)
合同是矩陣之間的一個關系。合同關系具有
- 自反性 \(A=E'AE\)
- 對稱性 由 \(B=C'AC\)可以得到\(A=(C^{-1})'BC^{-1}\)
- 傳遞性 由\(A_1=C_1'AC_1,A_2=C_2’AC_2\)即得\(A_2=(C_1C_2)'A(C_1C_2)\)
因此,經過非退化的線性替換,新的二次型的矩陣與二次型的矩陣是合同的。
標准形
- 數域\(P\)上任意一個二次型都可以經過非退化的線性替換變為平方和\(d_1x_1^2+d_2x_2^2+\cdots+d_nx_n^2\)的形式.
二次型\(f(x_1,x_2,\cdots,x_n)\)經過非退化線性替換所變成的平方和稱為\(f(x_1,x_2,\cdots,x_n)\)的一個標准形。
對應的矩陣是對角矩陣
-
在數域\(P\)上,任意一個對稱矩陣都合同於一對角矩陣。
-
在一個二次型的標准形中,系數不為零的平方項的個數是唯一確定的,與所做的非退化線性替換無關,二次型矩陣的秩有時就稱為二次型的秩
-
在一般的數域中,二次型的標准形不是唯一的而與所作的非退化的線性替換有關。
-
配方法
-
\(a_{ii}(i=1,2,\cdots,n)\)中至少有一個不為零,不妨設\(a_{11}\neq 0\),這時
\[f(x_1,x_2,\cdots,x_n)=a_{11}x_1^2+\sum_{j=2}^n{a_{1j}x_1x_j}+\sum_{i=2}^n{a_{i1}x_ix_1}+\sum_{i=2}^n\sum_{j=2}^{n}{a_{ij}x_ix_j} \\ =a_{11}x_1^2+2\sum_{j=2}^n{a_{1j}x_1x_j}+\sum_{i=2}^n\sum_{j=2}^{n}{a_{ij}x_ix_j} \ (合並x_1出現的交叉項)\\ =a_{11}(x_1+\sum_{j=2}^n{a_{11}^{-1}a_{1j}x_j})^2-a_{11}^{-1}(\sum_{j=2}^n{a_{1j}x_j})^2+\sum_{i=2}^n\sum_{j=2}^{n}{a_{ij}x_ix_j} \ (把x_1湊成平方和) \\ =a_{11}(x_1+\sum_{j=2}^n{a_{11}^{-1}a_{1j}x_j})^2+\sum_{i=2}^n\sum_{j=2}^{n}{b_{ij}x_ix_j} \\ 這里\sum_{i=2}^n\sum_{j=2}^{n}{b_{ij}x_ix_j}=-a_{11}^{-1}(\sum_{j=2}^n{a_{1j}x_j})^2+\sum_{i=2}^n\sum_{j=2}^{n}{a_{ij}x_ix_j}是一個x_2,x_3,\cdots,x_n的二次型 \]令
\[\begin{cases} y_1=x_1+\sum_{j=2}^{n}{a_{11}^{-1}a_{1j}x_j} \\ y_2=x_2\\ \ \ \ \cdots \cdots \\ y_n=x_n \\ \end{cases} \]即
\[\begin{cases} x_1=y_1-\sum_{j=2}^{n}{a_{11}^{-1}a_{1j}y_j} \\ x_2=y_2\\ \ \ \ \cdots \cdots \\ x_n=y_n \\ \end{cases} \]這是一個非退化線性替換,它使
\[f(x_1,x_2,\cdots,x_n)=a_{11}y_1^2+\sum_{i=2}^n\sum_{j=2}^{n}{b_{ij}y_iy_j} \] -
所有\(a_{ii}=0\),但至少有一\(a_{qj}\neq 0(j>1)\),不妨設\(a_{12}\neq 0\)
令
\[ \begin{cases} x_1=z_1+z_2 \\ x_2=z_1-z_2\\ x_3=z_3\\ \ \ \ \cdots \cdots \\ x_n=z_n \\ \end{cases} \] 它是非線性替換,且使
\[ f(x_1,x_2,\cdots,x_n)=2a_{12}x_1x_2+\cdots \\ =2a_{12}(z_1+z_2)(z_1-z_2)+\cdots \\ =2a_{12}z_1^2-2a_{12}z_2^2 \] 這時上式右端是\(z_1,z_2,\cdots,z_n\)的二次型,且\(z_1^2\)的系數不為零。
-
-
合同變換法
-
\(a_{11}\neq 0\).這時的變數替換為
\[\begin{cases} x_1=y_1-\sum_{j=2}^{n}{a_{11}^{-1}a_{1j}y_j} \\ x_2=y_2\\ \ \ \ \cdots \cdots \\ x_n=y_n \\ \end{cases} \]令
\[C_1= \left ( \begin{matrix} 1 & -a_{11}^{-1}a_{12} & \cdots & -a_{11}^{-1}a_{1n} \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & & \vdots \\ 0 & 0 & \cdots & 1 \\ \end{matrix} \right ) \]則上述變數替換相應於合同變換
\[A \rightarrow C_1^{'}AC_1= \left ( \begin{matrix} a_{11} & O \\ O &A_1-a_{11}^{-1}a'a\\ \end{matrix} \right )\\ 這里 a=(a_{12},\cdots,a_{1n}),A_1=\left ( \begin{matrix} a_{22} & \cdots & a_{2n} \\ \vdots & & \vdots \\ a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right ) \] -
\(a_{ii}=0,i=1,\cdots,n\)但有一\(a_{ij}\neq0,j\neq1\)
作合同變換\(P(2,j)'AP(2,j)\) 可以把\(a_{1j}\)搬到第一行第二列的位置,這樣就變成了配方法中第二種情況。
與第二種情形的變數替換相對應,取
\[C_1= \left ( \begin{matrix} 1 & 1 &0& \cdots & 0 \\ 1 & -1 &0& \cdots & 0 \\ 1 & 1 &1& \cdots & 0 \\ \vdots & \vdots & \vdots& \cdots & 0 \\ 0 & 0 &0& \cdots & 1 \end{matrix} \right ) \]於是\(C_1'AC_1\)的左上角就是
\[\left ( \begin{matrix} a_{12} & 0 \\ 0 & -2a_{12} \\ \end{matrix} \right ) \]可以歸結到第一種情形
-
規范形
-
復二次型的規范形
設\(f(x_1,x_2,\cdots,x_n)\)是一個復系數的二次型,經過一系列適當的非退化線性替換后,\(f(x_1,x_2,\cdots,x_n)\)變成標准形。
不妨假定它的標准形是\(d_1y_1^2+d_2y_2^2+\cdots+d_ry_r^2,d_i\neq 0,i=1,2,\cdots,r\),易知\(r\)就是\(f(x_1,x_2,\cdots,x_n)\)的秩。
因為復數總是可以開平方的,我們再做一個非退化的線性替換
\[\begin{cases} y_1=\frac{1}{\sqrt{d_1}}z_1 \\ \ \ \ \cdots \cdots \\ y_r=\frac{1}{\sqrt{d_r}}z_r\\ \ \ \ \cdots \cdots \\ y_{r+1}=z_{r+1}\\ \ \ \ \cdots \cdots \\ y_n=z_n \\ \end{cases} \]就變成
\[z_1^2+z_2^2+\cdots+z_r^2 \]上式稱為復二次型的規范形
-
定理 任意一個復系數的二次型,經過一個適當的非退化線性替換可以變成規范形,並且規范形是唯一的
-
定理 任一復數的對稱矩陣都合同於一個形式為
\[\left ( \begin{matrix} 1 & & & & & &\\ &\ddots & & & & & \\ & & 1 & & & & \\ & & & 0& & & \\ & & & &\ddots & & \\ & & & & & & 0 \\ \end{matrix} \right ) \]的對角矩陣,其中對角線上1的個數\(r\)等於\(A\)的秩。
兩個復數對稱矩陣合同的充分必要條件是它們的秩相等。
-
實二次型的規范形
設\(f(x_1,x_2,\cdots,x_n)\)是一個實系數的二次型,經過一系列適當的非退化線性替換后,再適當排列文字的次序,可使\(f(x_1,x_2,\cdots,x_n)\)變成標准形
\[d_1y_1^2+\cdots+d_py_p^2-d_{p+1}y_{p+1}^2-\cdots-d_ry_r^2,d_i>0,i=1,\cdots,r;r是二次型的秩 \]因為在實數域中,正實數總是可以開平方的,我們再做一個非退化的線性替換
就變成
上式稱為實二次型的規范形,顯然,規范形完全被\(r,p\)這兩個數所決定。
-
定理 任意一個實系數的二次型,經過一個適當的非退化線性替換可以變成規范形,並且規范形是唯一的。
-
任一復數的對稱矩陣都合同於一個形式為
\[\left ( \begin{matrix} 1 & & & & & &\\ &\ddots & & & & & \\ & & 1 & & & & \\ & & & -1& & & \\ & & & &\ddots & & \\ & & & & & & -1 \\ & & & & & & &0 \\ & & & & & & & &\ddots \\ & & & & & & & & &0 \\ \end{matrix} \right ) \]的對角矩陣,其中對角線上1的個數\(p\)及-1的個數\(r-p\)(\(r\)是矩陣\(A\)的秩)都是唯一確定的,分別稱為\(A\)的正、負慣性指數,它們的差\(2p-r\)稱為\(A\)的符號差。
兩個復數對稱矩陣合同的充分必要條件是它們的秩相等。
矩陣與線性空間
線性空間定義
-
非空集合 數域\(P\)上的一個非空集合\(V\)
-
對加法和數乘有封閉性
- 給出一個加法法則,對於\(V\)中任意兩個元素\(\alpha\)與\(\beta\),在\(V\)中都有唯一的一個元素\(\gamma\)與它們對應,稱為\(\alpha\)與\(\beta\)的和,記作\(\gamma=\alpha+\beta\)。
- 給出數量乘法運算,對於數域\(P\)中任一數\(k\)和\(V\)中任一元素\(\alpha\),在\(V\)中都有唯一的一個元素\(\delta\)與它們對應,稱為\(k\)與\(\alpha\)的數量乘積,記作\(\delta=k\alpha\)。
-
滿足8條規則
-
加法滿足下面四條規則:
- 加法交換律\(\alpha+\beta=\beta+\alpha\);
- 加法結合律\((\alpha+\beta)+\gamma=\alpha+(\beta+\gamma)\);
- 零元素 在\(V\)中有一個元素\(0\),對於\(V\)中任一元素\(\alpha\)都有\(0+\alpha=\alpha\)。\(0\)稱為\(V\)中的零元素。
- 負元素 對於\(V\)中的每一個元素\(\alpha\),都有\(V\)中的元素\(\beta\),使得\(\alpha+\beta=0\),。\(\beta\)稱為\(\alpha\)的負元素。
-
數量乘法滿足下面兩條規則:
- 單位元素 \(1 \alpha=\alpha\)。
- \(k(l\alpha)=(kl)\alpha\)
-
數量乘法與加法滿足下面兩條規則
- \((k+l)\alpha=k\alpha+l\alpha\)
- \(k(\alpha+\beta)=k\alpha+k\beta\)
在以上規則中\(k,l\)表示數域\(P\)中的任意數;\(\alpha,\beta,\gamma\)表示集合\(V\)中的任意元素。
-
線性空間中的元素也稱為向量,線性空間也稱為向量空間。
向量空間中基變換與坐標變換
在同一向量空間下,同一個向量在不同基下的坐標是不同的。

設\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)與\(\varepsilon_1',\varepsilon_2',\cdots,\varepsilon_n'\)是\(n\)維向量空間的兩組基,它們的關系是
設$\xi $在這兩組基下的坐標分別是 \(x_1,x_2,\cdots,x_n\)與$ x_1,x_2,\cdots,x_n$
將(3)式帶入(4)得
上式給出了在基變換(3)下向量的坐標變換公式。
矩陣與線性變換
線性變換的定義
線性空間\(V\)到自身的映射通常稱為\(V\)的一個變換。
-
定義
線性空間\(V\)的一個變換\(\mathscr{A}\)稱為線性變換,如果對於\(V\)中任意的元素\(\alpha,\beta\)和數域\(P\)中的任意數\(k\)都有
\[\mathscr{A}(\alpha+\beta)=\mathscr{A}(\alpha)+\mathscr{A}(\beta) \\ \mathscr{A}(k\alpha)+k\mathscr{A}(\alpha) \]線性變換\(\mathscr{A}\)保持向量的加法和數量乘法。

-
恆等變換、單位變換 \(\mathscr{E}(\alpha)=\alpha \ \ (\alpha \in V)\)
-
零變換\(\mathscr{0}\) \(\mathscr{0}(\alpha)=0 \ \ (\alpha \in V)\)
-
數乘變換 設\(V\)是數域\(P\)上的線性空間,\(k\)是數域\(P\)上的某個數,定義\(V\)的變換:\(\alpha \rightarrow k\alpha, \ \ \alpha\in V\)
這是一個線性變換,稱為由數\(k\)決定的數乘變換。
-
簡單性質
-
線性空間\(V\)的一個線性變換\(\mathscr{A}\),則\(\mathscr{A}(0)=0,\mathscr{A}(-a)=-\mathscr{A}(a)\)
-
線性變換保持線性組合不變
\[\beta=k_1\alpha_1+k_2\alpha_2+\cdots+k_r\alpha_r \\ \mathscr{A}(\beta)=k_1\mathscr{A}(\alpha_1)+k_2\mathscr{A}(\alpha_2)+\cdots+k_r\mathscr{A}(\alpha_r) \\ \] -
線性變換把線性相關的向量組變成線性相關的向量組。
-

線性變換\(\mathscr{A}\)在下基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)的矩陣
-
設\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是線性空間\(V\)的一組基。
如果線性變換\(\mathscr{A}\)與\(\mathscr{B}\)在這組基上的作用相同,即\(\mathscr{A}\varepsilon_i=\mathscr{B}\varepsilon_i,\ \ i=1,2,\cdots,n\) 那么\(\mathscr{A}=\mathscr{B}\)。
意義:一個線性變換完全被它在一組基上的作用決定
-
設\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是線性空間\(V\)的一組基。
對於任意一組向量\(\alpha_1,\alpha_2,\cdots,\alpha_n\),一定有一個線性變換\(\mathscr{A}\)使\(\mathscr{A}\varepsilon_i=\alpha_i,i=1,2,\cdots,n\)
意義:基向量的像完全可以是任意的
-
定理
設\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是線性空間\(V\)的一組基,\(\alpha_1,\alpha_2,\cdots,\alpha_n\)是\(V\)中的任意\(n\)個向量。
存在唯一的線性變換\(\mathscr{A}\)使\(\mathscr{A}\varepsilon_i=\alpha_i,i=1,2,\cdots,n\)
-
定義
設\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是數域\(P\)上\(n\)維線性空間\(V\)的一組基,\(\mathscr{A}\)是\(V\)的一個線性變換。
基向量的像可以被基線性表出:
\[\begin{cases} \mathscr{A}\varepsilon_1=a_{11}\varepsilon_1 +a_{12}\varepsilon_2+\cdots +a_{1n}\varepsilon_n \\ \mathscr{A}\varepsilon_2=a_{21}\varepsilon_1 +a_{22}\varepsilon_2+\cdots +a_{2n}\varepsilon_n \\ \ \ \ \cdots \cdots \\ \mathscr{A}\varepsilon_n=a_{n1}\varepsilon_1 +a_{n2}\varepsilon_2+\cdots +a_{nn}\varepsilon_n \\ \end{cases} \\ \mathscr{A}(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n) =(\mathscr{A}\varepsilon_1,\mathscr{A}\varepsilon_2,\cdots,\mathscr{A}\varepsilon_n) =(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n) \left ( \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{s1} & a_{s2} & \cdots & a_{sn} \\ \end{matrix} \right ) \\ A= \left ( \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{s1} & a_{s2} & \cdots & a_{sn} \\ \end{matrix} \right ) \]其中\(A\)稱為線性變換\(\mathscr{A}\)在下基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)的矩陣
在取定一組基后,我們就建立了由數域\(P\)上的\(n\)維線性空間\(V\)的線性變換到數域\(P\)上的\(n \times n\)矩陣的一個映射,1說明這個映射是單射,2說明是滿射,因此這個映射是一一對應的(雙射)。
-
定理
設\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是數域\(P\)上\(n\)維線性空間\(V\)的一組基,在這組基下,每個線性變換按着公式(3)對應一個\(n \times n\)矩陣。這個對應具有以下性質:
- 線性變換的和對應矩陣的和;
- 線性變換的乘積對應矩陣的乘積;
- 線性變換的數量乘積對應矩陣的數量乘積;
- 可逆的線性變換與可逆矩陣對應,且逆變換對應逆矩陣。
定理說明,數域\(P\)上\(n\)維線性空間\(V\)的全部線性變換構成的集合\(L(V)\)對於線性變換的加法與數量乘法構成\(P\)上一個線性空間,與數域\(P\)上\(n\)級方陣構成的線性空間\(P^{n \times n}\)同構。

線性變換的矩陣計算向量的像
-
定理
設線性變換\(\mathscr{A}\)在基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)下的矩陣是\(A\),向量\(\xi\)在基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)下的坐標是\((x_1,x_2,\cdots,x_n)\),
則\(\mathscr{A}\xi\)在基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)下的坐標\((y_1,y_2,\cdots,y_n)\)可以按公式
\[\left ( \begin{matrix} y_{1} \\ y_{2} \\ \vdots \\ y_{n} \\ \end{matrix} \right ) =A \left ( \begin{matrix} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \\ \end{matrix} \right ) \]計算。
線性變換的矩陣與基的關系
-
定理
線性空間\(V\)的線性變換\(\mathscr{A}\)在兩組基
\[\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n \\ \eta_1,\eta_2,\cdots,\eta_n \]下的矩陣分別是\(A,B\),從基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)到基\(\eta_1,\eta_2,\cdots,\eta_n\)的過渡矩陣是\(X\),於是\(B=X^{-1}AX\).
這個定理告訴我們,同一個線性變換\(\mathscr{A}\)在不同基下的矩陣之間的關系。
相似
-
定義 相似
設\(A、B\)是數域\(P\)上兩個\(n\)級矩陣,如果可以找到數域\(P\)上的\(n\)級可逆矩陣\(X\),使得\(B=X^{-1}AX\),就說\(A\)相似於\(B\),記作\(A \sim B\)
-
性質
- 自反性 \(A\sim A\)
- 對稱性 \(A \sim B ,B \sim A\)
- 傳遞性 \(A \sim B ,B \sim C\),則\(A \sim C\)
-
定理
線性變換在不同基下所對應的矩陣是相似的。
如果兩個矩陣相似,那么它們可以看作同一個線性變換在兩組基下所對應的矩陣。
-
運算性質
如果\(B_1=X^{-1}A_1X,B_2=X^{-1}A_2X\),那么
- \(B_1+B_2=X^{-1}(A_1+A_2)X\)
- \(B_1B_2=X^{-1}(A_1A_2)X\)
- 若\(f(x)\)是數域\(P\)上一多項式 \(f(B)=X^{-1}f(A)X\)
