超詳細解讀ORB-SLAM3單目初始化（下篇）

本文轉載自查看原文 2021-01-07 19:57 531

作者：喬不思

來源：微信公眾號|3D視覺工坊（系投稿）

3D視覺精品文章匯總：https://github.com/qxiaofan/awesome-3D-Vision-Papers/

一前言

本文承接ORB-SLAM3 細讀單目初始化過程(上)，ORBSLAM3單目視覺有很多知識點需要展開和深入，初始化過程是必然要經歷的，而網上資料不夠系統，因此本文主旨是從代碼實現出發，把初始化過程系統化，建立起知識樹，以把零碎的知識點串聯起來，方便快速學習提升自己。注意，本文雖然從代碼出發，但並非講全部代碼細節，如有需要建議直接看源代碼，地址是：https://github.com/UZ-SLAMLab/ORB_SLAM3，我自己稍微做了點修改，可以跑數據集的版本，可以參考一下，地址是：https://github.com/shanpenghui/ORB_SLAM3_Fixed

二初始化主要函數

ORBSLAM單目視覺SLAM的追蹤器接口是函數TrackMonocular，調用了GrabImageMonocular，其下面有2個主要的函數：Frame::Frame()和Tracking::Track()，本文和上篇都是按照以下框架流程來分解單目初始化過程，上篇記錄了Frame::Frame()，本文就記錄Tracking::Track()。

1 Tracking作用

ORB-SLAM3的Tracking部分作用論文已提及，包含輸入當前幀、初始化、相機位姿跟蹤、局部地圖跟蹤、關鍵幀處理、姿態更新與保存等，如圖。

2 兩個主要函數

單目地圖初始化函數是Tracking::MonocularInitialization，其主要是調用以下兩個函數完成了初始化過程，ORBmatcher::SearchForInitialization和KannalaBrandt8::ReconstructWithTwoViews，前者用於參考幀和當前幀的特征點匹配，后者利用構建的虛擬相機模型，針對不同相機計算基礎矩陣和單應性矩陣，選取最佳的模型來恢復出最開始兩幀之間的相對姿態，並進行三角化得到初始地圖點。

三 ORBmatcher::SearchForInitialization

這個函數的主要作用是構建旋轉角度直方圖，選取最優的三個Bin，也就是占據概率最大的三個Bin，如圖（數字3被異形吃掉了^-^）。因為當前幀會提取到諸多特征點，每一個都可以作為圖像旋轉角度的測量值，我們希望能在諸多的角度值中，選出最能代表當前幀的旋轉角度的測量值，這就是為什么要在旋轉角度直方圖中選最優的3個Bin的原因。

這個旋轉的角度哪來的呢？就是在計算描述子的時候算的，調用函數IC_Angle,代碼是：ORBextractor.cc#L475

keypoint->angle = IC_Angle(image, keypoint->pt, umax);

感興趣的同學想知道為什么要這么麻煩的選取最優3個角度，請從旋轉不變性開始理解，原理參見：3-5-3如何保證描述子旋轉不變性?

（https://blog.csdn.net/shanpenghui/article/details/109809723#t20）

四 KannalaBrandt8::ReconstructWithTwoView

1 畸變校正

利用魚眼模型，對兩幀圖像的特征點進行畸變校正，代碼見KannalaBrandt8.cpp#L219。要注意的是，魚眼模型的特殊性在於只考慮徑向畸變，忽略切向畸變，所以其p_ipi值都是0。想要深入理解魚眼模型的同學可以參考這篇文章《魚眼相機成像模型》

(https://blog.csdn.net/u010128736/article/details/52864024)。ORB-SLAM3中對不同模型相機的畸變校正做了區分，當相機模型是針孔的時候，用的畸變校正參數是mDistCoef，當相機模型是魚眼的時候，用的是虛擬出的相機類，代碼參見mpCamera = new KannalaBrandt8(vCamCalib)，為避免重復校正，用了個條件限制，就是在函數Frame::UndistortKeyPoints中判斷mDistCoef.at<float>(0)==0.0，代碼參見Frame.cc#L734，因為在用魚眼相機模型的時候，mDistCoef沒有賦值，都是0。

cv::fisheye::undistortPoints(vPts1,vPts1,K,D,R,K);
cv::fisheye::undistortPoints(vPts2,vPts2,K,D,R,K);

2 位姿估計

主要由函數TwoViewReconstruction::Reconstruct完成，涉及到的知識點又多又關鍵的，包括對極約束、八點法、歸一化、直接線性變換、卡方檢驗、重投影等，先從主要流程開始理解。

利用隨機種子DUtils::Random::SeedRandOnceTwoViewReconstruction.cc#L79，在所有匹配特征點對中隨機選擇8對匹配特征點為一組for(size_t j=0; j<8; j++)TwoViewReconstruction.cc#L86，用於估計H矩陣和F矩陣。
將當前幀和參考幀中的特征點坐標進行歸一化。TwoViewReconstruction::NormalizeTwoViewReconstruction.cc#L753
用DLT方法求解F矩陣 TwoViewReconstruction::ComputeF21TwoViewReconstruction.cc#L273
對給定的F矩陣打分,需要使用到卡方檢驗的知識 TwoViewReconstruction::CheckFundamentalTwoViewReconstruction.cc#L395
利用得到的最佳模型（選擇得分較高的矩陣值，單應矩陣H或者基礎矩陣F）估計兩幀之間的位姿，代碼中對應着函數ReconstructH或ReconstructF。其中，分兩個步驟。第一是利用基礎矩陣F和本質矩陣E的關系，計算出四組解。第二是調用的函數CheckRT作用是用R，t來對特征匹配點三角化，並根據三角化結果判斷R,t的合法性。最終可以得到最優解的條件是位於相機前方的3D點個數最多並且三角化視差角必須大於最小視差角。

2.2.4 基礎矩陣Fundamental 代數推導

有了以上的示意，我們嘗試用數學公式描述極點、極線和極平面之間的關系。看了好幾篇文章，感覺還是視覺十四講里面的代數推導比較明晰，我就直接參考過來，當做記錄了，其他比較雜亂，記錄在《SLAM 學習筆記本質矩陣E、基礎矩陣F、單應矩陣H的推導》（https://blog.csdn.net/shanpenghui/article/details/110133454），感興趣的同學可以看看。

設以第一個相機作為坐標系三維空間的點：

2.2.6 結尾

由於知識有限，加上篇幅限制，就不再展開了，這里可以參考另外幾篇比較好的文章，有比較詳細的推導過程，想深入研究的童鞋可以看看。

1、SLAM入門之視覺里程計(3)：兩視圖對極約束基礎矩陣

2、SLAM基礎知識總結（https://blog.csdn.net/MyArrow/article/details/53704339）

五、總結

單目方案的初始化過程再梳理一下：

對極約束是原理基礎，從物理世界出發描述了整個視覺相機成像、數據來源以及相互關系的根本問題，其中印象最深的是把搜索匹配點的范圍縮小成一段極線，大大加速了匹配過程。
八點法從求解的角度出發，用公式描述了獲得我們想要的解的最小條件，提供了有力的數學基礎。
歸一化使圖像進行縮放，而縮放尺度是為了讓噪聲對於圖像的影響在一個數量級上，從而減少噪聲對圖像的影響。
直接線性轉換則從諸多的測量值中（超過8點的N個匹配點，超定方程）算出了最優的解，使我們基本得到了想要的解。
在已經有的粗解基礎上利用統計學方法進行分析，篩選出優質的點（符合概率模型的內點）來構成我們最終使用的一個投影的最優解，利用兩幀圖像上匹配點對進行相互投影，綜合判斷內外點，從而最小化誤差。
篩選出內外點之后，對兩個模型進行打分，選出最優模型，然后通過三角化測量進行深度估計，最終完成初始化過程。

至此，單目的初始化過程（基於基礎矩陣F）就完啦，內容較多，希望不對的地方多多指教，相互學習，共同成長。以上僅是個人見解，如有紕漏望各位指出，謝謝。

參考：

1.對極幾何及單應矩陣https://blog.csdn.net/u012936940/article/details/80723609

2.2D-2D：對極約束https://blog.csdn.net/u014709760/article/details/88059000

3.多視圖幾何

https://blog.csdn.net/weixin_43847162/article/details/89363281

4.SVD分解及線性最小二乘問題

https://www.cnblogs.com/houkai/p/6656894.html

5.矩陣SVD分解（理論部分II——利用SVD求解最小二乘問題）

https://zhuanlan.zhihu.com/p/64273563

6.奇異值分解(SVD)原理詳解及推導

https://blog.csdn.net/zhongkejingwang/article/details/43053513

7.最小二乘解（Least-squares Minimization ）

https://blog.csdn.net/kokerf/article/details/72437294

8.卡方檢驗（Chi-square test / Chi-square goodness-of-fit test)

https://blog.csdn.net/zfcjhdq/article/details/83512680?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-3.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-3.control

9.樣本標准差與自由度 n-1 卡方分布關系的證明

https://blog.csdn.net/robert_chen1988/article/details/90640917

10.證明殘差平方和除隨機項方差服從卡方分布

https://www.docin.com/p-1185555448.html

11.本質矩陣優化分解的相對位姿估計

http://www.doc88.com/p-6931350248387.html

12.單目移動機器人的相對位姿估計方法

https://www.doc88.com/p-7744747222946.html

13.三角化求深度值（求三位坐標）

https://blog.csdn.net/michaelhan3/article/details/89483148

備注：作者也是我們「3D視覺從入門到精通」特邀嘉賓：一個超干貨的3D視覺學習社區

本文僅做學術分享，如有侵權，請聯系刪文。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 ORB-SLAM3 細讀單目初始化過程(上) ORB-SLAM3 單目地圖初始化（終結篇） ORB-SLAM2 論文&代碼學習 —— 單目初始化 ORB-SLAM （四）Initializer單目初始化 ORB-SLAM （四）tracking單目初始化 ORB-SLAM（三）地圖初始化 VI ORB-SLAM初始化與VINS初始化對比(將vi orb-slam初始化方法移植到vins中) ORB-Slam3 編譯測試重磅解讀！ORB-SLAM3，它來了，新增魚眼模型、多地圖等 SLAM初始化