有一維數組 [x1,x2...xn],要求一個值X,使得:
F(X) = (X-x1)2+(X-x2)2+...(X-xn)2 = min
F(X) = nX2 - 2 * (x1+x2+....+xn) + x12 + x22 + ...+xn2 = min
對X求導,當dF/dX = 0時,F(X)有極小值;
2nX - 2 (x1+x2+....+xn) = 0
那么,X = (x1+x2+....+xn) / n
因此,在一維的情況下,最小二乘求參數X,和求均值一樣;
使用矩陣的方法,先建立方程組:
X - x1 = 0
...
X - xn = 0
也就是方程組:
An*1X =b,等價於 [1,1,......] T X = [x1,x2...xn] T;
ATAX = ATb
同樣解得:X = (x1+x2+....+xn) / n
應用:在一維中,有[2,2,2,2,2,10]這樣子的數組,找出其中的孤值
先求出 X = 均值 = 3.333
中誤差 = sqrt [ [(2-3.333)2 + (2-3.333)2 + (2-3.333)2 + (2-3.333)2 + (2-3.333)2 + (10-3.333)2 ] / (6-1) ] = 3.1622
假如一維數組是對一段距離的觀測值,假設服從正態分布N[ μ,σ2] , u應該是接近2的數字,但實際上是不可知道的,樣本量大時,通常用X和中誤差來代替
|xn - u| > 2σ 的概率,為 1 - 95.449974%;
|xn - u| > 3σ 的概率,為 1 - 99.730020%;
所以,基於這個原理,|10 - 3.3333 | ≈ 2σ ,是屬於小概率事件,所以認為10是孤值;
加權最小二乘法;
假如,為上面每個數字,求加權平均值,假如權值分別為[p1,p2....pn],假如為[1,1,1,1,1,1/5]
加權並不是:X =( 2+ 2 + 2 + 2 +2 + 1 / 5 * 10 )/ 6 = 2;
而是F(X) = p1(X-x1)2+p2(X-x2)2+...p3(X-xn)2 = min
F'(X) = 2 (p1 + p2 + ... pn) - 2 (p1x1 + p2x2 + ... + pnXn)
因此X = (p1x1 + p2x2 + ... + pnXn) / (p1 + p2 +...+pn) = 12 / 5.2 = 2.3
如同解 ATPAX = ATPb
p越大,說明對某個觀測值越信賴,對其誤差也越信賴;
關於誤差傳播
假如x經過n次讀數,其中誤差 = Σ(xi - xavg)² / n,用矩陣的形式,就是Dxx = [x1-xavg ,x2-xavg,... xn-xavg] [x1-xavg ,x2-xavg,... xn-xavg] T / n
* 定義函數E(x)為求x的均值,那么Dxx = E[ [x1-xavg ,x2-xavg,... xn-xavg] [x1-xavg ,x2-xavg,... xn-xavg] T]
假如 y = ax,那么,其中誤差 = Σ(axi - axavg)² / n = a2 , 就是Dyy = a2 Dxx
因此,在一元的情況下 y = ax,y的方差D(Y) = a2 Dxx
多元的情況下:
z = ax - by ,用矩陣的形式表示,那么 Z = [a,b][x,y]T = KX
E(Z) = KE(X)
證明:
E(X) = [E(x),E(y)]T
E(Z) = ∑z / n = a * ∑x / n + b∑y / n = aE(x) + bE(y) = K[E(x),E(y)]T = KE(X)
D(Z) = E ( [Z-E(Z)] [Z-E(Z)]T)
= E ( [KX - KE(X)] [ KX - KE(X)]T)
= E ( K[X - E(X)] [ X - E(X)]T KT) (KA)T = ATKT
= KE ( [X - E(X)] [ X - E(X)]T ) KT
Dxx = E ( [X - E(X)] [ X - E(X)]T ) = [x-xavg ,y-yavg ] T [x-xavg ,y-yavg ] / n
X = [x,y]T , E(X) = [E(x),E(y)]T
因此,Dxx 對角 (x-E(x))(x-E(x))T / n,為x的方差; (y-E(y))(y-E(y))T / n 為y的方差;
非對角 (x-E(x))(y-E(y))T / n ,為x和y的協方差;
協方差的本質,是形容X的曲線,和Y的曲線的相似程度,其橫軸均為樣本序列
在實際解算的時候,如果兩種觀測量(x和y)是完全不相關的,例如: x代表測角、y代表測距 ,即使(x-E(x))(y-E(y))T / n ≠ 0,在Dxx的非對角處,任然寫為0值;
因此求Dzz要追根朔源
假如有:
z1 = a1x + b1y
z2 = a2x + b2y
z1和z2如何才是獨立觀測量,完全不相關?
等價於Dzz,非對角線元素為0

隱含條件:
1. a1、b1不能同時為0 ,否則相當於Z1沒有意義;
2. a2、b2不能同時為0 ,否則相當於Z2沒有意義;
3. σxx 和 σyy 均不能等於0,否則解算沒有意義,因為沒有誤差傳遞;
那么,要使得非對角線為0,那么:
1. a1 = 0 ,b2 = 0, σxy = 0;
1. b1 = 0 ,a2 = 0, σxy = 0;
沒有別的選擇;
因此,x、y必須是獨立觀測的,不相關的觀測量,而且,Z的方程組,每條方程的自變量均不相同,要么:
z1 = a1x
z2 = b2y
或者
z1 = b1y
z2 = a2x
