相似是研究線性變換矩陣之間的關系,首先需要確定一個線性空間,這是必要的,研究不同線性空間中變換矩陣的關系沒啥意義,確
定了線性空間,那么向量的維數,基中向量的個數都被定下來了。
定義:若 $A$ 和 $B$ 都是 $n$ 階矩陣,如果存在可逆矩陣 $P$,使得 $P^{-1}AP = B$,則稱矩陣 $A$ 與 $B$ 相似,記為 $A\sim B$。
理解相似矩陣,得先理解線性變換。
通俗一點來描述相似矩陣:同一個線性變換,不同參考系下的矩陣,稱為相似矩陣。
為什么我們需要相似矩陣呢?
對空間中的某一個向量做變換,需要先確定線性空間,並選定一組基來建立坐標系,選擇的坐標系越復雜,所做的變換也就越復雜,
計算量也越大,比如,需要將空間中的某一個向量 $\alpha$ 逆時針旋轉 $45$ 度,下面是選擇的幾組參考系:
很明顯在第三種坐標系,很容易寫出向量 $\alpha$ 逆時針旋轉 $45$ 度后的坐標。
所以:相似矩陣的目的是為了找到更簡單的坐標系來描述變換。
注:如果能選取不同基,使線性變換的矩陣變成對角矩陣,那么,線性變換的形式就會變得相對簡單。
建立不同的參考系,逆時針旋轉 $45$ 度這個變換的矩陣都不一樣,但是它們描述的是同一個線性變換,即本家兄弟,見面不認識,豈不成了笑
話。好在,我們可以找到同一個線性變換的矩陣兄弟們的一個性質,那就是:一定能找到一個非奇異矩陣 $P$,使得
$$P^{-1}AP = B$$
這個 $P$ 就是基 $(i_{1},j_{1})$ 到基 $(i_{2},j_{2})$ 的過渡矩陣,即
$$(i_{2},j_{2}) = (i_{1},j_{1}) \cdot P$$
設向量 $\alpha$ 在基 $i_{1},j_{1}$ 下的坐標為 $v_{1} = (x_{1},y_{1})^{T}$,在基 $i_{2},j_{2}$ 下的坐標為 $v_{2} = (x_{2},y_{2})^{T}$,於是
$$P \cdot v_{2} = v_{1}$$
設逆時針旋轉 $45$ 度在基 $i_{1},j_{1}$ 下的變換矩陣為 $A$,在基 $i_{2},j_{2}$ 下的變換矩陣為 $B$,基於兩個參考系的坐標變換關系有
$$Av_{1} = PBv_{2}$$
由 $v_{1}$ 和 $v_{2}$ 的關系有
$$APv_{2} = PBv_{2}$$
故
$$P^{-1}AP = B$$
當變換矩陣滿足什么樣的條件時,可以相似對角化?
設基向量 $(i,j)^{T}$,變換矩陣 $A$,向量 $\alpha = (a,b)$,則
$$A \begin{bmatrix}
i\\
j
\end{bmatrix}(a,b)$$
所以,線性變換其實是先作用於基向量,然后在進行矢量合成,現在我們要找一組基,使得線性變換 $A$ 在這組基的每一個向量上都是伸縮變換。
不妨將要找的這組基記為 $Q$,$Q$ 的參考系仍為 $S$,顯然矩陣 $A$ 的特征向量符合條件,同一個線性變換 $A$ 對它自己的特征向量的作用效果
就僅是進行伸縮而不是旋轉。
總結一下:相同的線性變換,作用於基向量 $S$ 會發生旋轉和伸縮,而作用於基向量 $Q$ 僅會發生伸縮。
現在將 $Q$ 作為參考系($Q$ 不放到 $S$ 中了),找一個矩陣 $B$ 和 $A$ 相似,就是意味着:$B$ 對參考系 $Q$ 的作用效果 $=$ 在參考系 $S$ 中,$A$ 對 $Q$ 的作用效果。
那 $A$ 對 $Q$ 產生了什么效果?伸縮了倍數為對應的特征值,那么要想 $B$ 也有這樣的效果,那 $B$ 必然是特征值構成的對角矩陣了。
定理:線性變換矩陣有 $n$ 個線性無關的特征向量 $\Leftrightarrow$ 可相似對角化。
這個怎么理解呢?
設一個變換矩陣 $A$,它所在的參考系為 $S$,$A$ 有 $n$ 個線性無關的特征向量 $\alpha_{1},\alpha_{2},...,\alpha_{n}$,設矩陣 $P$ 為
$$P = [\alpha_{1},\alpha_{2},...,\alpha_{n}] $$
現在我們以這 $n$ 個線性無關的特征向量作為新的基,將 $P$ 作為過渡矩陣,此時變換矩陣 $A$ 相對於新的基變成什么了呢?
設這 $n$ 個特征向量對應的特征值分別為 $\lambda_{1},\lambda_{2},...,\lambda_{n}$,則易知
$$A[\;\alpha_{1},\alpha_{2},...,\alpha_{n}\;] = [\;\lambda_{1}\alpha_{1},\lambda_{2}\alpha_{2},...,\lambda_{n}\alpha_{n}\;] =
[\;\alpha_{1},\alpha_{2},...,\alpha_{n}\;]
\begin{bmatrix}
\lambda_{1} & & & \\
& \lambda_{2} & & \\
& & ... & \\
& & & \lambda_{b}
\end{bmatrix}$$
即在過渡矩陣 $P$ 下,變換 $A$ 變成了
$$P^{-1}AP = \begin{bmatrix}
\lambda_{1} & & & \\
& \lambda_{2} & & \\
& & ... & \\
& & & \lambda_{b}
\end{bmatrix}$$
注:作為基的每個向量的單位長度不一定要相等,比如 $x$ 軸和 $y$ 軸的單位長度也可以不必相等。