矩陣和向量組和線性方程組之間的關系


對於這樣的線性方程組:

\begin{cases} 2x+3y=1\\ x+y=2\end{cases}

求解其答案的幾何意義是:

 

那么可以想象,解有以下三種情況:

  • 兩條直線有一個交點,方程組有一個解
  • 兩條直線共線,方程組有無數解
  • 兩條直線平行,方程組無解

如果從矩陣、向量的角度來看待這個問題,我們會得到一個全新的解題思路。

1 通過矩陣求解線性方程組

文章開頭提到的線性方程組:

\begin{cases} 2x+3y=1\\ x+y=2\end{cases}

我們可以寫成矩陣、向量的形式:

\begin{bmatrix} 2 & 3 \\ 1 & 1 \end{bmatrix}\begin{bmatrix} x \\ y \end{bmatrix}=\begin{bmatrix} 1 \\ 2 \end{bmatrix}

令 A=\begin{bmatrix} 2 & 3 \\ 1 & 1 \end{bmatrix} , \vec{x_{}}=\begin{bmatrix} x \\ y \end{bmatrix} , \vec{b_{}}=\begin{bmatrix} 1 \\ 2 \end{bmatrix} ,我們就得到了更一般的形式:

A\vec{x_{}}=\vec{b_{}}

要求解就要弄清楚這個矩陣方程的集合意義。

讓我們從線性空間說起。

1.1 線性空間

先忘掉坐標系,我們從一片空白開始:

我們隨便選個點作為原點,以此原點作兩個單位正交的向量(因為是二維的,所以兩個就夠了):

平面上的某個點,可以這樣表示:

我們簡化一下,這就變為了坐標的形式:

整個二維平面上的點,顯然都可以通過 a\vec{i_{}}+b\vec{j_{}},a\in \mathbb {R},b\in \mathbb {R} 的方式來表示。用數學的語言就是,整個二維平面是 \vec{i_{}},\vec{j_{}} 所張成的線性空間。

為了可視化張成的線性空間,我用灰色網格來表示,網格的交點就是整數坐標:

如果 \vec{i_{}},\vec{j_{}} 不正交,長度也不相等,那么依然張成整個二維空間,只是網格有所不同(坐標有所不同):

如果 \vec{i_{}},\vec{j_{}} 在一條直線上,那么就只能張成一維空間:

當然,如果 \vec{i_{}},\vec{j_{}} 都是原點,那么就只能張成零維空間了,也就是點。

1.2 A\vec{x_{}} 的幾何意義

我們把 \vec{x_{}} 在單位正交基 \vec{i_{}},\vec{j_{}} 下畫出來:

為了方便展示,我舉個具體的 A ,就用旋轉矩陣吧( A=\begin{bmatrix} cos(\theta ) & -sin(\theta ) \\ sin(\theta ) & cos(\theta ) \end{bmatrix} )。

那么 A\vec{x_{}} 的效果是讓 \vec{x_{}} 發生旋轉:

仔細觀察下,變換開始時:

變換結束后:

可以觀察到,整個變換過程是, \vec{x_{}} 以 \vec{i_{}},\vec{j_{}} 為基的坐標並沒有發生變換,而是 \vec{i_{}},\vec{j_{}} 這兩個基發生了旋轉,導致 \vec{x_{}} 發生了變換。

這就好比坐公交車:

我相對公交車沒有移動,但因公交車移動了,我的位置還是發生了變化。

整個移動過程用公交車這個比喻來描述,就是這樣的:

回到數學上來, A 就是這輛公交車,公交車的移動取決於 A 的列向量:

1.3 A\vec{x_{}}=\vec{b_{}} 的幾何意義

A\vec{x_{}}=\vec{b_{}} 就是說,通過 A 讓 \vec{x_{}} 運動到 \vec{b_{}} :

借用公交車的比喻,就是在 \vec{x_{}} 上車,通過公交車到達了 \vec{b_{}} 。

1.4 矩陣的秩與解

這個公交車有點古怪,並非某個點上車都能到達 \vec{b_{}} ,我們的任務就是找到那些可以到達 \vec{b_{}}的 \vec{x_{}} 。

這就需要研究這個公交車的站牌了:

從數學上說,公交車的站牌是由 A 的列空間決定的,讀懂了列空間就讀懂了站牌。

1.4.1 滿秩

比如,旋轉矩陣 A=\begin{bmatrix} cos(\theta ) & -sin(\theta ) \\ sin(\theta ) & cos(\theta ) \end{bmatrix} 的列空間是二維的:

即整個二維空間上的點都在這個公交車 A 的行駛范圍內,那么:

並且我們還可以觀察到,只有唯一一個點上車才可以到達 \vec{b_{}} :

列空間的維度實際上就是矩陣的秩(參看 這個回答 ),所以我們得到第一個數學結論,滿秩的矩陣,有唯一的解。

1.4.2 不滿秩

再比如,這個矩陣 A=\begin{bmatrix} 1 & 2 \\ 1 & 2 \end{bmatrix} 的列空間是一維的:

那么,假如:

這也就是無解的意思。

可以觀察出來, \begin{bmatrix} \vec{i_{}} & \vec{j_{}} \end{bmatrix} 的秩一定小於 \begin{bmatrix} \vec{i_{}} & \vec{j_{}} & \vec{b_{}} \end{bmatrix} ,那么可以得到第二個數學結論, \begin{bmatrix} \vec{i_{}} & \vec{j_{}} \end{bmatrix}的秩 < \begin{bmatrix} \vec{i_{}} & \vec{j_{}} & \vec{b_{}} \end{bmatrix} 的秩,那么無解。

如果 \vec{b_{}} 在 A 的列空間中,那么:

整條綠色線段上的點都會到達 \vec{b_{}} 點(多一句嘴, \vec{b_{}} 不一定會經過 A 到達 \vec{b_{}} 點),這就是有無數個解。

這個可以直觀去想象,空間由二維壓縮到一維,那么必然有無數多個點被壓縮到同一個點上去。

至此得到第三個數學結論: \begin{bmatrix} \vec{i_{}} & \vec{j_{}} \end{bmatrix} 的秩 = \begin{bmatrix} \vec{i_{}} & \vec{j_{}} & \vec{b_{}} \end{bmatrix} 的秩,並且不滿秩,那么有無數多個解。

1.5 小結

我們得到三個數學結論:

  • 滿秩的矩陣,有唯一的解
  • \begin{bmatrix} \vec{i_{}} & \vec{j_{}} \end{bmatrix} 的秩 < \begin{bmatrix} \vec{i_{}} & \vec{j_{}} & \vec{b_{}} \end{bmatrix} 的秩,無解
  • \begin{bmatrix} \vec{i_{}} & \vec{j_{}} \end{bmatrix} 的秩 = \begin{bmatrix} \vec{i_{}} & \vec{j_{}} & \vec{b_{}} \end{bmatrix} 的秩,無數解

經過我們上面的分析,應該還是挺直觀的吧。

繼續推下去很容易得到解的結構、零空間、解空間這些概念,這里就不推下去了,拋磚引玉,希望大家集思廣益。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM