對極幾何

本文轉載自查看原文 2017-12-22 11:54 2479 SLAM基礎積累

單目SLAM一般處理流程包括track和map兩部分。所謂的track是用來估計相機的位姿。而map部分就是計算pixel的深度，如果相機的位姿有了，就可以通過三角法(triangulation)確定pixel的深度，把這些計算好深度的pixel放到map里就重建出了三維環境。

http://blog.csdn.net/heyijia0327/article/details/50758944

1 對極幾何

（高翔7.3講）在正確匹配的基礎上求解相機運動---通過對極幾何列式子的基礎矩陣F或本征矩陣E或單應矩陣H，分解得R，t +（高翔7.5講）單目三角測量得深度

極線幾何約束是一種點對直線的約束，而不是點與點的約束，盡管如此，極線約束給出了對應點重要的約束條件，它將對應點匹配從整幅圖像尋找壓縮到在一條直線上尋找對應點。

在立體視覺測量中，立體匹配（對應點的匹配）是一項關鍵技術，極線幾何在其中起着重要作用。立體視覺系統中，有兩個攝像機在不同角度拍攝物理空間中的一實體點，在兩副圖像上分別成有有兩個成像點。立體匹配就是已知其中的一個成像點，在另一副圖像上找出該成像點的對應點---極限搜索（高翔13.2講）。極線幾何約束是一種常用的匹配約束技術。

這時，由共面得到的向量方程可寫成： (1)

所以式（1）可以寫成：這里寫圖片描述

2 計算本征矩陣E、尺度scale的來由

將矩陣相乘的形式拆開得到
這里寫圖片描述
上面這個方程左邊進行任意縮放都不會影響方程的解：

在應用的時候，考慮到E矩陣反正已經是縮放了的，所以更多的是直接令奇異值為(1,1,0)，程序如下：

有了本征矩陣E，就可以從E中恢復平移t和旋轉R。

3本征矩陣恢復R、T，尺度scale的進一步分析

從R,T的計算公式中可以看到R,T都有兩種情況，組合起來R,T有4種組合方式。由於一組R,T就決定了攝像機光心坐標系C的位姿，所以選擇正確R、T的方式就是，

把所有特征點的深度計算出來，看深度值是不是都大於0，深度都大於0的那組R,T就是正確的。

這個圖簡單明了的演示了這種平移縮放作用。從圖中也可以看出，由於尺度scale的關系，不同的t，決定了以后計算點P的深度也是不同的，所以恢復的物體深度也是跟尺度scale有關的，這就是論文中常說的結構恢復structure reconstruction，只是恢復了物體的結構框架，而不是實際意義的物體尺寸。

並且要十分注意，每兩對圖像計算E並恢復R,T時，他們的尺度都不是一樣的，本來是同一點，在不同尺寸下，深度不一樣了，這時候地圖map它最頭痛了，所以這個尺度需要統一。
那么如何統一呢？如果你一直采用這種2d-2d匹配計算位姿的方式，那每次計算的t都是在不同尺度下的。我們已經知道出現尺度不一致是由於每次都是用這種計算本征矩陣的方式，而尺度就是在計算E時產生的。所以尺度統一的另一種思路就是后續的位姿估計我不用這種2d-2d計算本征E的

隨着相機位姿誤差的積累，地圖中的四個點在第二幀的位置相對於第一幀中來說像是縮小了一樣。位姿誤差累計導致尺度漂移這一點，對照上面講尺度不確定問題時的那個圖就很容易理解。關於如何糾正這個scale drift的問題很多單目slam里都提到了，所以這里不再深入。
相機的軌跡有了，接下來就是structure reconstruction 了。

補充：特征點匹配（常見的有如下兩種方式）

1. 計算特征點，然后計算特征描述子，通過描述子來進行匹配，優點准確度高，缺點是描述子計算量大。

2. 光流法：在第一幅圖中檢測特征點，使用光流法(Lucas Kanade method)對這些特征點進行跟蹤，得到這些特征點在第二幅圖像中的位置，得到的位置可能和真實特征點所對應的位置有偏差。所以通常的做法是對第二幅圖也檢測特征點，如果檢測到的特征點位置和光流法預測的位置靠近，那就認為這個特征點和第一幅圖中的對應。在相鄰時刻光照條件幾乎不變的條件下（特別是單目slam的情形），光流法匹配是個不錯的選擇，它不需要計算特征描述子，計算量更小。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 對極幾何對極幾何幾何（Geometry）【多視圖幾何】對極幾何與基礎矩陣幾何觀止(經典幾何對象) 幾何概型【幾何基礎】01 - 幾何的公理系統計算幾何幾何函數庫計算幾何及其應用——解析幾何【幾何基礎】05 - 笛沙格幾何