http://blog.csdn.net/aptx704610875/article/details/48914043標定實例
一.總體原理:
攝像機標定(Camera calibration)簡單來說是從世界坐標系換到圖像坐標系的過程,也就是求最終的投影矩陣的過程。
[1]基本的坐標系:
- 世界坐標系;
- 相機坐標系;
- 成像平面坐標系;
- 像素坐標系
[2]一般來說,標定的過程分為兩個部分:
- 第一步是從世界坐標系轉換為相機坐標系,這一步是三維點到三維點的轉換,包括R,t(相機外參)等參數;
- 第二部是從相機坐標系轉為成像平面坐標系(像素坐標系),這一步是三維點到二維點的轉換,包括K(相機內參)等參數;
- 投影矩陣 : P=K [ R | t ] 是一個3×4矩陣,混合了內參和外參而成。
P=K[Rt]
二.基本知識介紹及
1、攝像機模型
camera centre
,即相機的中心點,也是相機坐標系的中心點;
principal axis
,即相機的主軸;
image plane
,即相機的像平面,也就是圖片坐標系所在的二維平面;
principal point
,即主點,主軸與像平面相交的點;
m
);
m
);
pixel
);

最終得出透視投影變換矩陣為:

設每個像素的物理尺寸大小為 dx * dy (mm) ( 由於單個像素點投影在圖像平面上是矩形而不是正方形,因此可能dx != dy),



就算大家身邊沒有這款相機也無所謂,可以在網上百度一下,很方便的就知道其一些參數——
焦距 f = 35mm 最高分辨率:4256×2832 傳感器尺寸:36.0×23.9 mm
根據以上定義可以有:
u0= 4256/2 = 2128 v0= 2832/2 = 1416 dx = 36.0/4256 dy = 23.9/2832
fx = f/dx = 4137.8 fy = f/dy = 4147.3
分辨率可以從顯示分辨率與圖像分辨率兩個方向來分類。
[1]顯示分辨率(屏幕分辨率)是屏幕圖像的精密度,是指顯示器所能顯示的像素有多少。由於屏幕上的點、線和面都是由像素組成的,
[2]圖像分辨率則是單位英寸中所包含的像素點數,其定義更趨近於分辨率本身的定義。
采用理想針孔模型,由於通過針孔的光線少,攝像機曝光太慢,在實際使用中均采用透鏡,可以使圖像生成迅速,但代價是引入了畸變。
有兩種畸變對投影圖像影響較大: 徑向畸變和切向畸變。
對某些透鏡,光線在遠離透鏡中心的地方比靠近中心的地方更加彎曲,產生“筒形”或“魚眼”現象,稱為徑向畸變。
xcorrected = x(1+k1r2+k2r4+k3r6)
ycorrected = y(1+k1r2+k2r4+k3r6)
這里(x, y)是畸變點在成像儀上的原始位置,r為該點距離成像儀中心的距離,(xcorrected ,ycorrected )是校正后的新位置。
對於一般的攝像機校正,通常使用泰勒級數中的前兩項k1和k2就夠了;對畸變很大的攝像機,比如魚眼透鏡,可以使用第三徑向畸變項k3
2、切向畸變
旋轉向量(大小為1×3的矢量或旋轉矩陣3×3)和平移向量(tx,ty,tz)。
旋轉向量:旋轉向量是旋轉矩陣緊湊的變現形式,旋轉向量為1×3的行矢量。
r就是旋轉向量,旋轉向量的方向是旋轉軸 ,旋轉向量的模為圍繞旋轉軸旋轉的角度。
通過上面的公式,我們就可以求解出旋轉矩陣R。同樣的已知旋轉矩陣,我們也可以通過下面的公式求解得到旋轉向量:
那么可以利用這些來進行最終的任務相機標定,簡單的過程可以描述為通過標定板,如下圖,可以得到n個對應的世界坐標三維點Xi和對應的圖像坐標二維點xi,這些三維點到二維點的轉換都可以通過上面提到的相機內參K,相機外參R和t,以及畸變參數D,經過一系列的矩陣變換得到。
利用這些對應關系來求解相機參數。(每個鏡頭的畸變程度各不相同,通過相機標定可以校正這種鏡頭畸變。)
七.求解過程的分析:
1.假設有N個角點和K個棋盤圖像(不同位置),需要多少個視場和角點才能提供足夠的約束來求解這些參數呢?
K個棋盤,可以提供2NK的約束,即2NK的方程。(乘以2是因為每個點都由x和y兩個坐標值組成)
忽略每次的畸變,那么我們需要求解4個內參數和6K個外參數。(因為對於不同的視場,6個外參數是不同的)
那么有解的前提是方程的總數應該大於等於未知參數的總數即2NK>=6K+4,或者寫成(N-3)K>=2。
為了方便理解,下圖是一個3×3大小的棋盤,紅色圈標記出了它含有的內角點:
如果我們令N=5,K=1,帶入到上述不等式,是滿足不等式,這就是意味着我們僅需要一個視場和帶有5個內角點的棋盤就可以求解出10個參數了。其實不然,為了描述投影視場的所有目標只需要4個點,即一次性在四個方向上延展正方形的邊,把它變成任意四邊形。因此,無論一個平面上檢測到多少個角點,我們只能得到4個有用的角點信息。如上圖所示是一個3×3大小的棋盤,有4個內角點。對於每一個視場,我們僅能給出4個有用的角點信息,那么上述的公式中N就約束為4,即公式變為(4-3)K>=2,即K>=2。即要求解10個參數最少需要兩個視場。考慮到噪聲和數值穩定性要求,對大棋盤需求收集更多的圖像。為了得到高質量結果,至少需要10幅7×8或者更大棋盤的圖像(而且只在移動棋盤在不同圖像中足夠大以從視場圖像中得到更加豐富的信息)。
2.數學是怎么應用於標定的?
OpenCV選着那些能夠很好工作於平面物體的方法。OpenCV中使用的求解焦距和偏移的算法是基於張的方法,但求解畸變參數則是另外一個基於Brown的方法。
(1)首先我們假定求解標定參數時,攝像機沒有畸變。對於每一個棋盤視場,我們得到一個前面描述的單應性矩陣H,大小為3×3。將H寫成列向量的形式,即H=[h1 h2 h3],每個h是3×1向量,單應性矩陣H是物理變換(旋轉、平移)和相機內參數組成。我們的目的就是分解這個H,能夠從中分解出這些成分。
M是攝像機內參數矩陣,r1,r2是旋轉矢量3×1,t是平移矢量,縮放因子s,對應項相等得到如下:
λ=1/s
我們知道R=[r1,r2,r3],r3消失,是因為我們另Z=0。R是一個正交陣,即R的轉置等於R的逆。正交陣的每個列向量是兩兩正交且單位化的(即模為1),那么r1和r2是相互正交。
正交的含義有兩個:兩個矢量的點積為0,兩個矢量的長度相等。下面我們就用這兩個約束來進行求解。
我們將r1和r2帶入到上述的公式得:
令:
展開有:
其中M公式如下:
(注意:這里的cx、Cy相當於上面的U0、V0)
將M帶入公式,可以得到矩陣B的通用形式的封閉解:
這里重新寫一下兩個約束:
由於B是對稱真,那么B可以僅有對角線下半元素或者對角線上半元素表示,即可以有6個元素表示。我們將通用形式展開,並且提取出B成分,那么通用形式可以寫成含有旋轉成分和含有B成分的6個元素組成的向量的點積(注意:是點積,不是兩個矩陣相乘),如下:
從上述公式,我們已知單應性矩陣H,那么它其中的每一個元素我們都是已知的,那么上述Bij是我們要求解的值,
我們可以組合兩個約束為如下的形式:
每一個視場我們可以得到形如上面描述的2個公式(上述黃色部分),那么對於K的視場,我們可以得到2K個這樣的公式。
我們堆積這些方程有:
b是要求解未知數矢量大小為6×1,V是2K×6的矩陣,如果K>=2,那么方程有解b=[B11,B12,B22,B13,B23,B33]T。攝像機內參數可以從B矩陣的封閉解中直接得到:
外參數(旋轉和平移)可以由單應性條件計算得到:
上述公式中,λ,M,H,都是求解的得到的作為已知量,(r3=r1×r2,這是因為r1,r2,r3兩兩正交)。
需要小心的是,當我們使用真實的數據求解時,將計算得到的r向量放在一起(R=(r1,r2,r3)),我們並不能得到精確的旋轉矩陣R,使得R為正交陣。
為了解決這個問題,我們常使用強制的方法,即對R進行奇異值分解,R=UDVT,U,V為正交陣,D為對角陣,如果R是正交陣,那么奇異值分解后的對角陣D是單位陣,那么我們將單位陣I代替對角陣D,進而重構出滿足正交條件的R.
(2)在前面的工作中,我們總是先忽略透鏡畸變,然后求解得到的系統。如果針孔模型是完美的,令(xp,yp)為點的位置,令(xd,yd)為畸變的位置,那么有:
通過下面的替換,可以得到沒有畸變的標定結果:
就像先前描述的那樣,上述5個畸變參數:k1,k2,k3,p1,p2,需要3個角點構成的6組方程就可以求解。我們猜測一下,我們通過前面的計算已經求解出相機的內參數:fx,fy,cx,cy,棋盤平面上角點的坐標為世界坐標,其中X,Y我們可以理解為在其平面上的坐標,Z是一個尺度,因為我們知道求解單應性矩陣H,也是一個尺度,所以具體怎么控制,先不用管,我們就可以通過上述公式一求解出xp和yp,xd,yd就是成像儀上角點的真實位置,那么就可以由xp,yp和xd,yd的點對,帶入到上述的公式二,求可以求解出5個畸變系數。
就是將一個原本是n維的向量用一個n+1維向量來表示。
許多圖形應用涉及到幾何變換,主要包括平移、旋轉、縮放。以矩陣表達式來計算這些變換時,平移是矩陣相加,旋轉和縮放則是矩陣相乘,綜合起來可以表示 為x=R*X+t (注:因為習慣的原因,實際使用時一般使用變化矩陣左乘向量)(R 旋轉縮放矩陣,t 為平移矩陣,X 為原向量,x 為變換后的向量)。