病態矩陣
測量是人類對居住的這個世界獲取空間認識的一種手段,也是認識世界的一種活動。因此,在參與測量活動中,自然會遇到認識活動中的三種情況:a.很容易就發現了不同之處而將甲乙兩事物區分開來;b.很容易就發現了相同之處而將甲乙兩事物歸於一類;c.難於將甲乙兩事物區分開來,從而造成認識上的混淆,產生錯誤的結果。前兩者比較易於處理,后者處理起來比較困難。例如,在實地上測量一個點的位置時,至少需要兩個要素:或者兩個角度,或者兩條邊長,或者一個角度和一條邊長。把已知點視為觀察點,將待定點視為目標點,從一個觀察點出發,對於目標點形成一個視野。當僅從一個視野或者從兩個很接近的視野觀察目標時,所獲得的關於目標的知識是極其不可靠的,且極為有限的。要獲得可靠的知識,必須從至少兩個明顯不同的視野進行觀察。同時,目標點與觀察點之間則構成了一個認識系統。這個系統用數學語言表示出來,反應為矩陣。
但是,有時候在現實中的作業條件不允許我們有足夠多的觀察點供選擇,使我們處於不利的位置,或者只能從很短的基線來觀測很遠的目標。此時,得到的認識系統則不夠堅強,亦即該矩陣不能夠將觀測數據映射為可靠的結果。我們稱此類矩陣為病態的。從幾何意義上來說,相當於用於交會定點的直線之間的夾角太小。從向量線性關系的角度來看,相當於用於交會定點的向量之間接近於線性相關。這就是矩陣病態的本質。
另一方面,大家知道,任何觀測數據都包含有誤差,那是因為觀測設備的分辨率與制造誤差、觀測者、觀測環境等因素造成的。因此,這些誤差也要通過矩陣來影響我們希望獲得的結果。由於浮點數所引入的微小的量化誤差,也會導致求逆結果的非常大誤差。
當系統反應為病態矩陣時,微小的誤差對結果將產生較大的影響。另一方面,當系統反應為良態矩陣時,同樣大小的誤差對結果產生的影響卻比病態矩陣小很多。這表明,認識系統的特性是決定認識結果的可靠性的根本因素。
因此,要解決矩陣病態的問題,必須從改善認識系統的結構方面入手。從這個思路出發,可以先將認識系統中的相互間夾角較小的向量找出來,然后以其中一個向量為對稱軸,旋轉其余向量到某個合適的位置,得到一個良態的認識系統,再行求解。這樣做的優點在於不涉及求點的具體位置。
例如,最小二乘法所產生的病態矩陣問題主要是由於矩陣求逆所造成的,我們使用QR分解方法來解決。
QR分解
矩陣分解是指將一個矩陣表示為結構簡單或具有特殊性質的若干矩陣之積或之和,大體可以分為滿秩分解、QR分解和奇異值分解。矩陣分解在矩陣分析中占有很重要的地位,常用來解決各種復雜的問題。而QR分解是工程應用中最為廣泛的一類矩陣分解。
QR分解也稱為正交三角分解,矩陣QR分解是一種特殊的三角分解,在解決矩陣特征值的計算、最小二乘法等問題中起到重要作用。
QR分解定理:任意一個滿秩矩陣A,都可以唯一的分解為A=QR,其中Q為正交矩陣,R為正對角元上的三角矩陣。
標准正交基:
向量是標准正交的,如果它們滿足如下條件
如果一個矩陣的列是標准正交的,我們稱之為Q,很容易可以得到
當Q是方陣的時候,我們可以得到,也即轉置等於逆
投影矩陣:以二維空間為例
向量p是b在a上的投影,也稱為b在a上的分量,可以用b乘以a方向的單位向量來計算,現在,我們打算嘗試用更貼近線性代數的方式表達。
因為p在a上,所以p實際上是a的一個子空間,可以將它看做a縮放x倍,因此向量p可以用p=xa來表示,只要找出x即可,因為,所以二者的點積為0:
和
都是點積運算,最后將得到一個標量數字:
b在a上的投影p,表明當b縮放時,p也縮放相同的倍數,當a縮放時,p保持不變。
由於向量點積是一個數字,p可以進一步寫成:
在二維空間中,分子是一個2x2矩陣,這說明向量b在a上的投影p是一個矩陣作用在b上得到的,這個矩陣就稱為投影矩陣,用大寫的P表達:
擴展到n維空間,a是n維向量,投影矩陣就是n×n的方陣,觀察投影矩陣發現,它是由一個列向量乘以一個行向量得到的:
可以看出的列向量是線性相關的,所以它的列空間和行空間的維度都是1,表明它的秩為1,
是一個秩為1的矩陣,並且是一個對稱矩陣,由於
是一個標量,所以
決定了投影矩陣的性質:
投影矩陣還有另外一個性質:
它的幾何意義是,對一個向量投影兩次和投影一次相同,b在a上的投影是p,再投影一次仍是p。
投影的意義:
從方程Ax=b說起,對於ax=b來說,並不是任何時候都有解,實際上大多數這種類型的方程都無解。A的列空間的含義是方程組有解時b的取值空間,當b不在A的列空間時,方程無解。
雖然方程無解,但我們還是希望能夠運算下去,這就需要換個思路,不追求可解,轉而尋找最接近可解問題的解。對於無解方程Ax=b,Ax總是在列空間里(因為列空間是由Ax確定的,和b無關),而b就不一定了,所以需要微調b,將b變成列空間中最接近它的一個,Ax=b變成了:。
P就是A的列空間的投影,b-p產生最小的誤差向量:
求解不等式方程Ax=b,需要將b微調成它在A的列空間上的投影(列空間上的向量很多,b在列空間上的投影是唯一的),這就是投影的意義。
推廣到多維投影矩陣使用如下公式表示:
Gram-Schmidt正交化和A的QR分解:
假設有三個不相關的向量a,b,c,如果能夠構造出正交的三個向量A,B,C,那么再除以它們的長度就得到了標准正交向量。
首先,選取A=a,那么B必須垂直於A。我們用b減去其在A的投影,就得到了垂直於A的部分,這也就是要找的B。
接着再用c減去其在A和B的投影,就得到要找的C
如果有更多的向量,就用新的向量減去它在已經設定好的所有向量上的投影即可,最后,再除以它們各自的長度就得到了標准正交向量。
標准正交向量
A垂直於B證明:
此處的||A||表示向量的模
A=QR,R是上三角陣,Q是單位正交陣
已知
由上述可知,所以
,即左下角元素為零
最小二乘法的正規方程由QR分解的結果來重新生成參數計算公式: