從零開始一起學習SLAM | 理解圖優化，一步步帶你看懂g2o代碼

本文轉載自查看原文 2019-01-18 09:42 8058 SLAM/ 計算機視覺/ g2o

首發於公眾號：計算機視覺life 旗下知識星球「從零開始學習SLAM」

這可能是最清晰講解g2o代碼框架的文章

理解圖優化，一步步帶你看懂g2o框架

小白：師兄師兄，最近我在看SLAM的優化算法，有種方法叫“圖優化”，以前學習算法的時候還有一個優化方法叫“凸優化”，這兩個不是一個東西吧？

師兄：哈哈，這個問題有意思，雖然它們中文發音一樣，但是意思差別大着呢！我們來看看英文表達吧，圖優化的英文是 graph optimization 或者 graph-based optimization，你看，它的“圖”其實是數據結構中的graph。而凸優化的英文是 convex optimization，這里的“凸”其實是凸函數的意思，所以單從英文就能區分開它們。

小白：原來是這樣，我看SLAM中圖優化用的很多啊，我看了一下高博的書，還是迷迷糊糊的，求科普啊師兄

師兄：圖優化真的蠻重要的，概念其實不負責，主要是編程稍微有點復雜。。

小白：不能同意更多。。，那個代碼看的我一臉懵逼

圖優化有什么優勢？

師兄：按照慣例，我還是先說說圖優化的背景吧。SLAM的后端一般分為兩種處理方法，一種是以擴展卡爾曼濾波（EKF）為代表的濾波方法，一種是以圖優化為代表的非線性優化方法。不過，目前SLAM研究的主流熱點幾乎都是基於圖優化的。

小白：據我所知，濾波方法很早就有了，前人的研究也很深。為什么現在圖優化變成了主流了？

師兄：你說的沒錯。濾波方法尤其是EKF方法，在SLAM發展很長的一段歷史中一直占據主導地位，早期的大神們研究了各種各樣的濾波器來改善濾波效果，那會入門SLAM，EKF是必須要掌握的。順便總結下濾波方法的優缺點：

優點：在當時計算資源受限、待估計量比較簡單的情況下，EKF為代表的濾波方法比較有效，經常用在激光SLAM中。

缺點：它的一個大缺點就是存儲量和狀態量是平方增長關系，因為存儲的是協方差矩陣，因此不適合大型場景。而現在基於視覺的SLAM方案，路標點（特征點）數據很大，濾波方法根本吃不消，所以此時濾波的方法效率非常低。

小白：原來如此。那圖優化在視覺SLAM中效率很高嗎？

師兄：這個其實說來話長了。很久很久以前，其實就是不到十年前吧(感覺好像很久)，大家還都是用濾波方法，因為在圖優化里，Bundle Adjustment（后面簡稱BA）起到了核心作用。但是那會SLAM的研究者們發現包含大量特征點和相機位姿的BA計算量其實很大，根本沒辦法實時。

小白：啊？后來發生了什么？（認真聽故事ing）

師兄：后來SLAM研究者們發現了其實在視覺SLAM中，雖然包含大量特征點和相機位姿，但其實BA是稀疏的，稀疏的就好辦了，就可以加速了啊！比較代表性的就是2009年，幾個大神發表了自己的研究成果《SBA：A software package for generic sparse bundle adjustment》，而且計算機硬件發展也很快，因此基於圖優化的視覺SLAM也可以實時了！

小白：厲害厲害！向大牛們致敬！

圖優化是什么？

小白：圖優化既然是主流，那我可以跳過濾波方法直接學習圖優化吧，反正濾波方法也看不懂。。

師兄：額，圖優化確實是主流，以后有需要你可以再去看濾波方法，那我們今天就只講圖優化好啦

小白：好滴，那問題來了，究竟什么是圖優化啊？

師兄：圖優化里的圖就是數據結構里的圖，一個圖由若干個頂點（vertex），以及連接這些頂點的邊（edge）組成，給你舉個例子

比如一個機器人在房屋里移動，它在某個時刻 t 的位姿（pose）就是一個頂點，這個也是待優化的變量。而位姿之間的關系就構成了一個邊，比如時刻 t 和時刻 t+1 之間的相對位姿變換矩陣就是邊，邊通常表示誤差項。

在SLAM里，圖優化一般分解為兩個任務：

1、構建圖。機器人位姿作為頂點，位姿間關系作為邊。

2、優化圖。調整機器人的位姿（頂點）來盡量滿足邊的約束，使得誤差最小。

下面就是一個直觀的例子。我們根據機器人位姿來作為圖的頂點，這個位姿可以來自機器人的編碼器，也可以是ICP匹配得到的，圖的邊就是位姿之間的關系。由於誤差的存在，實際上機器人建立的地圖是不准的，如下圖左。我們通過設置邊的約束，使得圖優化向着滿足邊約束的方向優化，最后得到了一個優化后的地圖（如下圖中所示），它和真正的地圖（下圖右）非常接近。

小白：哇塞，這個圖優化效果這么明顯啊！剛開始誤差那么大，最后都校正過來了

師兄：是啊，所以圖優化在SLAM中舉足輕重啊，一定得掌握！

小白：好，有學習的動力了！我們開啟編程模式吧！

先了解g2o 框架

師兄：前面我們簡單介紹了圖優化，你也看到了它的神通廣大，那如何編程實現呢？

小白：對啊，有沒有現成的庫啊，我還只是個“調包俠”。。

師兄：這個必須有啊！在SLAM領域，基於圖優化的一個用的非常廣泛的庫就是g2o，它是General Graphic Optimization 的簡稱，是一個用來優化非線性誤差函數的c++框架。這個庫可以滿足你調包俠的夢想~

小白：哈哈，太好了，否則打死我也寫不出來啊！那這個g2o怎么用呢？

師兄：我先說安裝吧，其實g2o安裝很簡單，參考GitHub上官網：

https://github.com/RainerKuemmerle/g2o

按照步驟來安裝就行了。需要注意的是安裝之前確保電腦上已經安裝好了第三方依賴。

小白：好的，這個看起來很好裝。不過問題是，我看相關的代碼，感覺很復雜啊，不知如何下手啊

師兄：別急，第一次接觸g2o，確實有這種感覺，而且官網文檔寫的也比較“不通俗不易懂”，不過如果你能捋順了它的框架，再去看代碼，應該很快能夠入手了

小白：是的，先對框架了然於胸才行，不然即使能湊合看懂別人代碼，自己也不會寫啊！

師兄：嗯嗯，其實g2o幫助我們實現了很多內部的算法，只是在進行構造的時候，需要遵循一些規則，在我看來這是可以接受的，畢竟一個程序不可能滿足所有的要求，因此在以后g2o的使用中還是應該多看多記，這樣才能更好的使用這個庫。

小白：記住了。養成記筆記的好習慣，還要多練習。

師兄：好，那我們首先看一下下面這個圖，是g2o的基本框架結構。如果你查資料的話，你會在很多地方都能看到。看圖的時候要注意箭頭類型

1、圖的核心

小白：師兄，這個圖該從哪里開始看？感覺好多東西。。

師兄：如果你想要知道這個圖中哪個最重要，就去看看箭頭源頭在哪里

小白：我看看。。。好像是最左側的SparseOptimizer？

師兄：對的，SparseOptimizer是整個圖的核心，我們注意右上角的 is-a 實心箭頭，這個SparseOptimizer它是一個Optimizable Graph，從而也是一個超圖（HyperGraph）。

小白：我去，師兄，怎么突然冒出來這么多奇怪的術語，都啥意思啊？

師兄：這個你不需要一個個弄懂，不然可能黃花菜都涼了。你先暫時只需要了解一下它們的名字，有些以后用不到，有些以后用到了再回看。目前如果遇到重要的我會具體解釋。

小白：好。那下一步看哪里？

2、頂點和邊

師兄：我們先來看上面的結構吧。注意看 has-many 箭頭，你看這個超圖包含了許多頂點（HyperGraph::Vertex）和邊（HyperGraph::Edge）。而這些頂點頂點繼承自 Base Vertex，也就是OptimizableGraph::Vertex，而邊可以繼承自 BaseUnaryEdge（單邊）, BaseBinaryEdge（雙邊）或BaseMultiEdge（多邊），它們都叫做OptimizableGraph::Edge

小白：頭有點暈了，師兄

師兄：哈哈，不用一個個記，現階段了解這些就行。頂點和邊在編程中很重要的，關於頂點和邊的定義我們以后會詳細說的。下面我們來看底部的結構。

小白：嗯嗯，知道啦！

3、配置SparseOptimizer的優化算法和求解器

師兄：你看下面，整個圖的核心SparseOptimizer 包含一個優化算法（OptimizationAlgorithm）的對象。OptimizationAlgorithm是通過OptimizationWithHessian 來實現的。其中迭代策略可以從Gauss-Newton（高斯牛頓法，簡稱GN）, Levernberg-Marquardt（簡稱LM法）, Powell's dogleg 三者中間選擇一個（我們常用的是GN和LM）

小白：GN和LM就是我們以前講過的非線性優化方法中常用的兩種吧
師兄：是的，如果不了解的話具體看《從零開始學習「張氏相機標定法」（四）優化算法前傳》《從零開始學習「張氏相機標定法」（五）優化算法正傳》這兩篇文章。

4、如何求解

師兄：那么如何求解呢？OptimizationWithHessian 內部包含一個求解器（Solver），這個Solver實際是由一個BlockSolver組成的。這個BlockSolver有兩個部分，一個是SparseBlockMatrix ，用於計算稀疏的雅可比和Hessian矩陣；一個是線性方程的求解器（LinearSolver），它用於計算迭代過程中最關鍵的一步HΔx=−b，LinearSolver有幾種方法可以選擇：PCG, CSparse, Choldmod，具體定義后面會介紹

到此，就是上面圖的一個簡單理解。

一步步帶你看懂g2o編程流程

小白：師兄，看完了我也不知道編程時具體怎么編呢！

師兄：我正好要說這個。首先這里需要說一下，我們梳理是從頂層到底層，但是編程實現時需要反過來，像建房子一樣，從底層開始搭建框架一直到頂層。g2o的整個框架就是按照下圖中我標的這個順序來寫的。

高博在十四講中g2o求解曲線參數的例子來說明，源代碼地址

https://github.com/gaoxiang12/slambook/edit/master/ch6/g2o_curve_fitting/main.cpp

為了方便理解，我重新加了注釋。如下所示，

typedef g2o::BlockSolver< g2o::BlockSolverTraits<3,1> > Block;  // 每個誤差項優化變量維度為3，誤差值維度為1

// 第1步：創建一個線性求解器LinearSolver
Block::LinearSolverType* linearSolver = new g2o::LinearSolverDense<Block::PoseMatrixType>(); 

// 第2步：創建BlockSolver。並用上面定義的線性求解器初始化
Block* solver_ptr = new Block( linearSolver );      

// 第3步：創建總求解器solver。並從GN, LM, DogLeg 中選一個，再用上述塊求解器BlockSolver初始化
g2o::OptimizationAlgorithmLevenberg* solver = new g2o::OptimizationAlgorithmLevenberg( solver_ptr );

// 第4步：創建終極大boss 稀疏優化器（SparseOptimizer）
g2o::SparseOptimizer optimizer;     // 圖模型
optimizer.setAlgorithm( solver );   // 設置求解器
optimizer.setVerbose( true );       // 打開調試輸出

// 第5步：定義圖的頂點和邊。並添加到SparseOptimizer中
CurveFittingVertex* v = new CurveFittingVertex(); //往圖中增加頂點
v->setEstimate( Eigen::Vector3d(0,0,0) );
v->setId(0);
optimizer.addVertex( v );
for ( int i=0; i<N; i++ )    // 往圖中增加邊
{
  CurveFittingEdge* edge = new CurveFittingEdge( x_data[i] );
  edge->setId(i);
  edge->setVertex( 0, v );                // 設置連接的頂點
  edge->setMeasurement( y_data[i] );      // 觀測數值
  edge->setInformation( Eigen::Matrix<double,1,1>::Identity()*1/(w_sigma*w_sigma) ); // 信息矩陣：協方差矩陣之逆
  optimizer.addEdge( edge );
}

// 第6步：設置優化參數，開始執行優化
optimizer.initializeOptimization();
optimizer.optimize(100);

結合上面的流程圖和代碼。下面一步步解釋具體步驟。

1、創建一個線性求解器LinearSolver

我們要求的增量方程的形式是：H△X=-b，通常情況下想到的方法就是直接求逆，也就是△X=-H.inv*b。看起來好像很簡單，但這有個前提，就是H的維度較小，此時只需要矩陣的求逆就能解決問題。但是當H的維度較大時，矩陣求逆變得很困難，求解問題也變得很復雜。

小白：那有什么辦法嗎？

師兄：辦法肯定是有的。此時我們就需要一些特殊的方法對矩陣進行求逆，你看下圖是GitHub上g2o相關部分的代碼

如果你點進去看，可以分別查看每個方法的解釋，如果不想挨個點進去看，看看下面我的總結就行了

LinearSolverCholmod ：使用sparse cholesky分解法。繼承自LinearSolverCCS
LinearSolverCSparse：使用CSparse法。繼承自LinearSolverCCS
LinearSolverPCG ：使用preconditioned conjugate gradient 法，繼承自LinearSolver
LinearSolverDense ：使用dense cholesky分解法。繼承自LinearSolver
LinearSolverEigen： 依賴項只有eigen，使用eigen中sparse Cholesky 求解，因此編譯好后可以方便的在其他地方使用，性能和CSparse差不多。繼承自LinearSolver

2、創建BlockSolver。並用上面定義的線性求解器初始化。

BlockSolver 內部包含 LinearSolver，用上面我們定義的線性求解器LinearSolver來初始化。它的定義在如下文件夾內：

g2o/g2o/core/block_solver.h

你點進去會發現 BlockSolver有兩種定義方式

一種是指定的固定變量的solver，我們來看一下定義

 using BlockSolverPL = BlockSolver< BlockSolverTraits<p, l> >;

其中p代表pose的維度（注意一定是流形manifold下的最小表示），l表示landmark的維度

另一種是可變尺寸的solver，定義如下

using BlockSolverX = BlockSolverPL<Eigen::Dynamic, Eigen::Dynamic>;

小白：為何會有可變尺寸的solver呢？

師兄：這是因為在某些應用場景，我們的Pose和Landmark在程序開始時並不能確定，那么此時這個塊狀求解器就沒辦法固定變量，此時使用這個可變尺寸的solver，所有的參數都在中間過程中被確定

另外你看block_solver.h的最后，預定義了比較常用的幾種類型，如下所示：

BlockSolver_6_3 ：表示pose 是6維，觀測點是3維。用於3D SLAM中的BA
BlockSolver_7_3：在BlockSolver_6_3 的基礎上多了一個scale
BlockSolver_3_2：表示pose 是3維，觀測點是2維

以后遇到了知道這些數字是什么意思就行了

3、創建總求解器solver。並從GN, LM, DogLeg 中選一個，再用上述塊求解器BlockSolver初始化

我們來看g2o/g2o/core/ 目錄下，發現Solver的優化方法有三種：分別是高斯牛頓（GaussNewton）法，LM（Levenberg–Marquardt）法、Dogleg法，如下圖所示，也和前面的圖相匹配

小白：師兄，上圖最后那個OptimizationAlgorithmWithHessian 是干嘛的？

師兄：你點進去 GN、 LM、 Doglet算法內部，會發現他們都繼承自同一個類：OptimizationWithHessian，如下圖所示，這也和我們最前面那個圖是相符的

然后，我們點進去看 OptimizationAlgorithmWithHessian，發現它又繼承自OptimizationAlgorithm，這也和前面的相符

總之，在該階段，我們可以選則三種方法：

g2o::OptimizationAlgorithmGaussNewton
g2o::OptimizationAlgorithmLevenberg 
g2o::OptimizationAlgorithmDogleg

4、創建終極大boss 稀疏優化器（SparseOptimizer），並用已定義求解器作為求解方法。

創建稀疏優化器

g2o::SparseOptimizer    optimizer;

用前面定義好的求解器作為求解方法：

SparseOptimizer::setAlgorithm(OptimizationAlgorithm* algorithm)

其中setVerbose是設置優化過程輸出信息用的

SparseOptimizer::setVerbose(bool verbose)

不信我們來看一下它的定義

5、定義圖的頂點和邊。並添加到SparseOptimizer中。

這部分比較復雜，我們下一次再介紹。

6、設置優化參數，開始執行優化。

設置SparseOptimizer的初始化、迭代次數、保存結果等。

初始化

SparseOptimizer::initializeOptimization(HyperGraph::EdgeSet& eset)

設置迭代次數，然后就開始執行圖優化了。

SparseOptimizer::optimize(int iterations, bool online)

小白：終於搞明白g2o流程了！謝謝師兄！必須給你個「好看」啊！

注：以上內容部分參考了如下文章，感謝原作者：

https://www.jianshu.com/p/e16ffb5b265d

https://blog.csdn.net/heyijia0327/article/details/47686523

討論

我們知道（不知道的話，去查一下十四講）用g2o和ceres庫都能用來進行BA優化，這兩者在使用過程中有什么不同？

歡迎留言討論，更多學習視頻、文檔資料、參考答案等關注計算機視覺life公眾號，，菜單欄點擊“知識星球”查看「從零開始學習SLAM」星球介紹，快來和其他小伙伴一起學習交流~

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 從零開始一起學習SLAM | 掌握g2o邊的代碼套路一步步帶你，如何網站架構帶你們一步步了解flask框架深入理解圖優化與g2o：g2o篇代碼和設計是如何一步步腐化的我是這樣一步步理解--主題模型(Topic Model)、LDA(案例代碼) 一步步學習 Spring Data 系列之JPA（一）一步步學習NHibernate(6)——ISession的管理機器學習：一步步教你理解反向傳播方法【One by one系列】一步步學習docker（一）