1. 二次型
含有 $n$ 個變量 $x_{1},x_{2},...,x_{n}$ 的二次齊次函數 $f(x_{1},x_{2},...,x_{n})$ 稱為 $n$ 元二次型,即在一個多項式中,未知數的
個數為任意多個,但每一項的次數都為 $2$ 的多項式,如
$$f(x) = ax^{2} \\
f(x,y) = ax^{2} + by^{2} + cxy \\
f(x,y,z) = ax^{2} + by^{2} + cz^{2} + dxy + exz + fyz$$
它起源於幾何學中二次曲線方程和二次曲面方程化為標准形問題的研究。
二次型中每一項都是二次的,沒有一次項和常數項,之所以不研究包含一次項和常數項的二次非齊次多項式,是由於:
一次項與常數項的改變不會影響函數圖像的大致形狀。
一個二次型可以用一個矩陣表示成如下的形式:
$$f(x) = x^{T}Ax$$
其中 $x$ 是自變量組成的列向量。
一定都會找到一個對稱的矩陣 $A$ 來表示表示這個二次型,假如 $A$ 不對稱,那么必然有對稱矩陣 $B = (A + A^{T}) / 2$ 滿足
$$x^{T}Ax = x^{T}Bx$$
因為實對稱矩陣具有許多特別的性質,為了方便研究,規定二次型矩陣就是一個實對稱矩陣。
更為關鍵的是:如果二次型矩陣是對稱的,那么它將是唯一的。
二次型的圖形:為了方便研究二次型,我們代入具體的函數值,研究一個具體的圖形:
$$x^{T}Ax = C$$
這樣就表示成一個曲線或者曲面,這個圖形由取具體函數值的自變量全體構成的。描述它的參考系(少了函數值那個維度)不同,
二次型矩陣也不同,這涉及到合同的概念。
2. 矩陣合同
在線性代數,特別是二次型理論中,常常用到矩陣間的合同關系。
定義:設 $A$ 和 $B$ 是兩個 $n$ 階方陣,若存在可逆矩陣 $C$,使得
$$C^{T}AC = B$$
則方陣 $A$ 與 $B$ 合同,$A$ 到 $B$ 的變換 $C$ 稱為合同變換。
那矩陣 $A$ 和 $B$ 合同到底有什么意義呢?我們已經知道相似是相同的線性變換在不同基下的表示,那合同呢?
下面針對一個二次型的圖形來表述,即代入具體函數值之后的曲線或曲面。
合同矩陣不是一種變換,它代表着一個二次型的圖形,同一個圖形在不同的參考系下位置不同,意味着描述它的矩陣不同。
注意:這個參考系是描述自變量的,比如函數 $f(x,y)$,那么參考系就是 $x$ 軸和 $y$ 軸 $2$ 個維度,選擇不同的基構成它們,二次型矩陣也不同。
舉一個例子,下面是兩個不同的參考系描述同一個圖形,
雖然在不同的參考系下得到的多項式或二次型矩陣不同,但我們得知道它們是不是同一個圖形,於是有合同的概念。
兩個合同的矩陣是:同一個圖形在不同基下的表示。
那怎么判斷兩個矩陣合同呢?
證明:
選定兩組基,矩陣 $C$ 是兩個基之間的過渡矩陣,設 $x,y$ 是圖形上同一個點在兩個參考系中的坐標表示,即它們對應的函數值相同,則有
$$x = Cy$$
於是有
$$x^{T}Ax = (Cy)^{T}B(Cy) = y^{T}C^{T}BCy$$
所以
$$A = C^{T}BC$$
證畢
-------------------------------------------------------------------分割線-----------------------------------------------------------------------
二次型的標准型:經過一個可逆線性變換,即過渡矩陣 $C$ 的作用,原二次型矩陣 $A$ 變成一個對角陣,即二次型函數變成
$$f(y) = d_{1}y_{1}^{2} + d_{2}y_{2}^{2} + ... + d_{n}y_{n}^{2}$$
我們知道兩個矩陣合同是二次型圖形在不同基下的不同表示,那合同於一個對角陣意味着什么呢?
先來觀察一下這個函數,可以直觀地看出,它是一個偶函數,關於各個坐標軸對稱,故在這個參考系下,這個二次型的圖形是“正”着的。
一個二次型的標准型並不唯一,單位長度發生變化,或者每個基向量的單位長度不相同,對於同一個圖形,它們的標准型便不同。
那如何將一個二次型變成標准型呢?
根據實對稱矩陣的特點,我們知道一個 $n$ 階的二次型矩陣存在 $n$ 個線性無關且正交的特征向量,於是存在一個正交矩陣 $C$ 使它
相似於一個對角陣,即
$$C^{-1}AC = \Lambda$$
由正交矩陣的性質知
$$C^{-1} = C^{T}$$
所以有
$$C^{T}AC = \Lambda$$
所以只要求出二次型矩陣的 $n$ 個正交的特征向量,那它們構成的矩陣即為產生標准型的一種線性變換,為什么說是一種呢?
因為變成標准型的線性變換並不唯一,標准型也不唯一。
二次型標准型的平方項系數不一定就是特征值,要看標准型是通過什么轉換完成的。如果是正交變換,那變換出來的系數是特征值。
如果是配方法,那系數就不是特征值。配方法得出的標准型和正交法標准型有同樣的規范型。
任意一個線性變換矩陣都可以得到一個合同矩陣,存在一個與之對應的參考系。
--------------------------------------------------------------------分割線----------------------------------------------------------------------
二次型的規范型:一個對稱矩陣的規范型是指與它合同的最簡對角陣,對角線上的元素只可能有 $1,-1,0$ 且按 $1,...,1,-1,...,-1,0,...,0$ 排列。
正慣性指數:系數為正的平方項的個數為二次型的正慣性指數。
對於兩個二次型矩陣:合同 $\Leftrightarrow$ 有相同的正負慣性指數。
一個二次型矩陣可以合同於一個規范型,即合同於一個對角線上只有 $\pm 1$ 以及 $0$ 的對角矩陣。
下面我們來做一個證明:
由於一個二次型肯定可以合同於一個對角陣,所以我們只需要證明:一個任意的對角陣合同於一個對角線上只有 $\pm 1$ 以及 $0$ 的對角矩陣。
隨便設一個矩陣
$$C = \begin{bmatrix}
a & & \\
& b & \\
& & 0
\end{bmatrix}$$
設矩陣 $P$ 為
$$\begin{bmatrix}
\frac{1}{\sqrt{|a|}} & & \\
& \frac{1}{\sqrt{|b|}} & \\
& & 0
\end{bmatrix}$$
於是有
$$P^{T}CP = \begin{bmatrix}
\frac{1}{\sqrt{|a|}} & & \\
& \frac{1}{\sqrt{|b|}} & \\
& & 0
\end{bmatrix}
\begin{bmatrix}
a & & \\
& b & \\
& & 0
\end{bmatrix}
\begin{bmatrix}
\frac{1}{\sqrt{|a|}} & & \\
& \frac{1}{\sqrt{|b|}} & \\
& & 0
\end{bmatrix} =
\begin{bmatrix}
\frac{a}{\sqrt{|a|}} & & \\
& \frac{b}{\sqrt{|b|}} & \\
& & 0
\end{bmatrix}
\begin{bmatrix}
\frac{1}{\sqrt{|a|}} & & \\
& \frac{1}{\sqrt{|b|}} & \\
& & 0
\end{bmatrix} =
\begin{bmatrix}
\frac{a}{|a|} & & \\
& \frac{b}{|b|} & \\
& & 0
\end{bmatrix}$$
按這種方式構造矩陣,所有對角陣都會合同於一個由 $\pm 1$ 以及 $0$ 組成的對角陣,而 $\pm 1$ 的個數取決於原矩陣的正負慣性指數。
根據合同的傳遞性,只要二次型矩陣有相同的正負慣性指數,則它們就會合同。
那將一個二次型矩陣變成規范性,變換后的參考系長啥樣呢?
來看一個例子,假如原先的參考系為標准正交基,即笛卡爾坐標系,對於橢圓
$$\frac{x^{2}}{16} + \frac{y^{2}}{9} = 1$$
它的二次型矩陣為
$$A = \begin{bmatrix}
\frac{1}{16} & \\
& \frac{1}{9}
\end{bmatrix}$$
圖形如下
已經是一個對角陣,現在我們將它變成規范型,做變換
$$B = \begin{bmatrix}
4 & \\
& 3
\end{bmatrix}
\begin{bmatrix}
\frac{1}{16} & \\
& \frac{1}{9}
\end{bmatrix}
\begin{bmatrix}
4 & \\
& 3
\end{bmatrix} =
\begin{bmatrix}
1 & \\
& 1
\end{bmatrix}$$
對應的二次型為
$$x^{2} + y^{2} = 1$$
怎么似乎把它變成了一個圓?其實不是,合同變換不會改變圖形的形狀,只是參考系變了,通過過渡矩陣
$$P =
\begin{bmatrix}
4 & \\
& 3
\end{bmatrix}$$
參考系變化情況如下圖
在這個參考系中,$x$ 軸和 $y$ 軸的單位長度是不等長的。
--------------------------------------------------------------------分割線----------------------------------------------------------------------
正定二次型:對任意的非零向量,恆有 $f(x) = x^{T}Ax > 0$,則稱 $f$ 正定或矩陣 $A$ 正定。
直觀上,只要自變量不是原點,即不是全 $0$,那么函數的圖像就在正半軸上。
$n$ 階實對稱矩陣 $A$ 正定
$\Leftrightarrow$ $A$ 的正慣性指數等於 $n$
$\Leftrightarrow$ $A$ 與單位陣合同
$\Leftrightarrow$ $A$ 的特征值全部大於 $0$
這上面 $3$ 點很容易理解,因為任何一個二次型矩陣都可以通過正交變換合同於一個對角陣,如果特征值存在 $0$ 或者負值,如
$$f(x) = \lambda_{1}x_{1}^{2} + \lambda_{2}x_{2}^{2} + ... + \lambda_{n}x_{n}^{2}$$
設 $\lambda_{1} < 0$,那么必定存在非 $0$ 向量 $x = (1,0,0,...,0)$ 使函數值為負值。
$\Leftrightarrow$ $A$ 的順序主子式大於 $0$
1)先證明:正定 $\Rightarrow$ 順序主子式大於 $0$
設二次型
$$f(x_{1},x_{2},...,x_{n}) = \sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}x_{i}x_{j}$$
我們的目的是證明左上角的任意一個 $k$ 階子矩陣的行列式 $>$ 0,這個子矩陣本身也構成一個 $k$ 元二次型,即
$$f(x_{1},x_{2},...x_{k},0,...,0) = \sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}x_{i}x_{j}$$
由於原二次型正定,這樣取向量后,這個 $k$ 元二次型也得是正定的,故其特征值全部大於 $0$,即行列式大於 $0$。
2)再證明:順序主子式大於 $0$ $\Rightarrow$ 正定
采用數學歸納法,當 $n = 1$ 時,
$$f(x_{1}) = a_{11}x^{2}$$
由於 $a_{11} > 0$,故 $f(x_{1})$ 正定。
假設對於 $n-1$ 階矩陣,其順序主子式大於 $0$ 推出正定成立,現在來證明 $n$ 元的情形。
設 $\alpha$ 為列向量,將矩陣 $A$ 分塊寫成
$$A = \begin{bmatrix}
A_{n-1} & \alpha \\
\alpha^{T} & b
\end{bmatrix}$$
其中 $A$ 和 $A_{1}$ 的順序主子式全都大於 $0$。
由假設知 $A_{1}$ 是正定矩陣,即存在可逆的 $n-1$ 階矩陣 $G$,使
$$G^{T}A_{1}G = E_{n-1}$$
即矩陣 $A_{1}$ 合同於一個單位陣,構造一個矩陣 $C_{1}$,
$$C_{1} = \begin{bmatrix}
G & 0\\
0 & 1
\end{bmatrix}$$
於是有
$$C_{1}^{T}AC_{1} = \begin{bmatrix}
G^{T} & 0\\
0 & 1
\end{bmatrix}
\begin{bmatrix}
A_{n-1} & \alpha \\
\alpha^{T} & b
\end{bmatrix}
\begin{bmatrix}
G & 0\\
0 & 1
\end{bmatrix} =
\begin{bmatrix}
E_{n-1} & G^{T}\alpha \\
\alpha^{T}G & b
\end{bmatrix}$$
再構造一個矩陣 $C_{2}$,
$$C_{2} = \begin{bmatrix}
E_{n-1} & -G^{T}\alpha \\
0 & 1
\end{bmatrix}$$
於是有
$$C_{2}^{T}C_{1}^{T}AC_{1}C_{2} =
\begin{bmatrix}
E_{n-1} & 0 \\
-\alpha^{T}G & 1
\end{bmatrix}
\begin{bmatrix}
E_{n-1} & G^{T}\alpha \\
\alpha^{T}G & b
\end{bmatrix}
\begin{bmatrix}
E_{n-1} & -G^{T}\alpha \\
0 & 1
\end{bmatrix} =
\begin{bmatrix}
E_{n-1} & 0 \\
0 & b - \alpha^{T}GG^{T}\alpha
\end{bmatrix}$$
由於 $|A| > 0$,故 $b - \alpha^{T}GG^{T}\alpha > 0$,所以正慣性指數為 $n$。