ICRA2020重磅來襲——SLAM文章匯總


作者:魏宏宇

來源:公眾號@3D視覺工坊

鏈接:ICRA2020重磅來襲——SLAM文章匯總

ICRA(International Conference on Robotics and Automation)會議是最大的機器人會議,也是IEEE機器人與自動化學會的旗艦會議。ICRA2020共收到3512篇論文,其中ICRA2020收錄了2456篇,IEEE Robotics and Automation Letters(RA-L)收錄990篇。共12個方向的論文獲得了2020IRCA獎項,獲獎篇數共36篇。ICRA會議論文中最受歡迎的10個關鍵詞依次為:Deep Learning in Robotics and Automation、Motion and Planning、Localization、Learning and Adaptive Systems、Autonomous Vehicle Navigation、Multi-Robot Systems、SLAM、Object Detection、Segmentation and Categorization、Visual-Based Navigation【1】

在本文中針對SLAM部分的論文進行梳理和簡單介紹,共44篇,后續還會針對較為經典的文章進行解讀。

1.Real-Time Graph-Based SLAM with Occupancy Normal Distributions Transforms

2.Spatio-Temporal Non-Rigid Registration of 3D Point Clouds of Plants

3.Uncertainty-Based Adaptive Sensor Fusion for Visual-Inertial Odometry under Various Motion Characteristics

4.Loam_livox: A Fast, Robust, High-Precision LiDAR Odometry and Mapping Package for LiDARs of Small FoV論文主要針對激光雷達測程和繪圖(LOAM)展開研究,在該論文中作者提出了一個魯邦的實時的LOAM算法用於小型Fov和不規則采樣,通過在前端和后端進行優化,解決了由這種激光雷達產生的幾個基本挑戰,並在精度和效率方面取得了比現有基線更好的性能。

論文地址:https://arxiv.org/pdf/1909.06700v1.pdf代碼地址:https://github.com/hku-mars/loam_livox

5.Active SLAM Using 3D Submap Saliency for Underwater Volumetric Exploration

6.Are We Ready for Service Robots? the OpenLORIS-Scene Datasets for Lifelong SLAM服務機器人應該能夠在一段時間內在動態和日常變化的環境中自主運行。而SLAM是機器人自主最基本的問題之一,現有的SLAM大部分工作都是利用短時間內記錄的數據序列進行評估。在現實生活中,自然因素和人類活動都會造成視線以外的場景的變化,這使得機器人長期工作和穩定的估計姿態面臨巨大挑戰。論文中引入長時SLAM(lifelong SLAM)一詞,用於處理長期變化環境下的SLAM問題。論文中發布了OpenLORIS-Scene數據集,該數據集在真實的室內場景中收集數據,並手機了現實生活中的多種場景變化。同時設計了長時SLAM的基准度量,分別對姿態估計的魯棒性和精度進行評估。

論文地址:https://arxiv.org/pdf/1911.05603.pdf

數據集地址:lifelong-robotic-vision.github.io/dataset/scene.

7.Intensity Scan Context: Coding Intensity and Geometry Relations for Loop Closure Detection

回環檢測在SLAM中是一個較為重要的部分,現有的三D回環檢測常常利用局部或全局幾何描述符的匹配,但沒有考慮強度讀取。論文中對激光雷達的強度特性進行探究,從而發現激光雷達掃描是一種有效的位置識別方法。我們提出一個新的全局描述子,強度掃描上下文算法。為了提高回環檢測的效率,還提出了一個有效的兩階段分層再識別過程,包括基於二進制運算的快速幾何關系檢索和強度結構再識別。

論文地址:https://arxiv.org/pdf/2003.05656.pdf

8.TextSLAM: Visual SLAM with Planar Text Features

論文中提議將人工場景中的文本目標整合到視覺SLAM系統中,基於文本的SLAM算法的核心在於將每一個檢測到的文本視為一個具有豐富紋理和語義的平面特征。通過采用亮度不變的光度誤差,將文本特征用三個參數簡潔地表示,並集成到視覺SLAM中。該論文首次將紋理特征融合到視覺SLAM中。

論文地址:https://arxiv.org/pdf/1912.05002.pdf

9.FlowNorm: A Learning-Based Method for Increasing Convergence Range of Direct Alignment論文提出了一種新的魯棒范數,稱FlowNorm,其利用了圖像的局部誤差項和全局圖像配准信息,從而實現了前所未有的收斂范圍,在這個收斂范圍下,圖像可以在大視角變化或小重疊的情況下對齊。

論文地址:https://arxiv.org/pdf/1910.07217v1.pdf

10.Redesigning SLAM for Arbitrary Multi-Camera Systems

論文提出了一個自適應SLAM系統,可以在任意多相機設定中工作。另外,還提出了一個自適應初始化方案,一種傳感器不確定,信息理論的關鍵幀選擇算法以及一個可擴展的基於體素的地圖。論文地址:https://arxiv.org/pdf/2003.02014.pdf

11.Dynamic SLAM: The Need for Speed在大多SLAM算法中大多假設靜態環境,但在實際動態環境中需要識別移動的物體並實時估計它們的速度。在論文中提出一種新的基於特征的、無模型的、目標感知動態SLAM算法,該算法不需要估計對象的姿態或任何3D模型的先驗信息,而是利用語義分割來估計場景中的剛體運動。

論文地址:https://arxiv.org/pdf/2002.08584.pdf

12.GradSLAM: Dense SLAM Meets Automatic Differentiation

論文提出SLAM(gradSLAM),在SLAM上呈現一個可微的計算圖。利用計算圖的自動分區功能,SLAM使SLAM系統的設計允許跨其每個組件或整個系統進行基於梯度的學習。

論文地址:https://arxiv.org/pdf/1910.10672.pdf

13.Long-Term Place Recognition through Worst-Case Graph Matching to Integrate Landmark Appearances and Spatial Relationships

14.Linear RGB-D SLAM for Atlanta World

15.Stereo Visual Inertial Odometry with Online Baseline Calibration

16.Lidar-Monocular Visual Odometry Using Point and Line Features17.Probabilistic Data Association Via Mixture Models for Robust Semantic SLAM

論文中闡述並處理了如目標檢測等方法中存在的語義和幾何不確定度。具體來說,對數據關聯的模糊度進行建模,這是一種典型的非高斯模型。通過最大邊際化消除數據關聯變量的推理過程,保持標准高斯后驗假設。其結果是一個max-mixture類型的模型,該模型考慮了多個數據關聯假設以及不正確的回環。論文地址:https://arxiv.org/pdf/1909.11213.pdf

18.Closed-Loop Benchmarking of Stereo Visual-Inertial SLAM Systems: Understanding the Impact of Drift and Latency on Tracking Accuracy

論文中,提出了視覺估計延遲在閉環導航任務中的重要性問題。為了解漂移和延遲在視覺慣性系統中的影響,設計了閉關基准模擬,在實驗中利用視覺慣性估計的反饋,機器人被命令跟隨一個期望的軌跡。

論文地址:https://arxiv.org/pdf/2003.01317.pdf

19.Metrically-Scaled Monocular SLAM Using Learned Scale Factors

20.Inertial-Only Optimization for Visual-Inertial Initialization

論文中,在最大后驗估計的情況下,首次將視覺慣性初始化問題表示為一個最優估計問題,這使我們能夠適當地考慮IMU測量的不確定度。論文地址:https://arxiv.org/pdf/2003.05766.pdf

21.Hierarchical Quadtree Feature Optical Flow Tracking Based Sparse Pose-Graph Visual-Inertial SLAM

22.Keypoint Description by Descriptor Fusion Using Autoencoders23.Towards Noise Resilient SLAM24.LAMP: Large-Scale Autonomous Mapping and Positioning for Exploration of Perceptually-Degraded Subterranean Environments

在大規模的、未知的、復雜的地下環境中進行SLAM是一個具有挑戰性的問題,傳感器必須在非標稱條件下工作;不平整和光滑的地形會使輪式里程計測量不准確,沒有顯著特征的長走廊會使感覺模糊,容易漂移;最后,在隧道和礦井等重復出現的環境中經常出現的偽回環可能會導致整個映射的嚴重失真。本文報告了在DARPA地下挑戰賽中開發的基於雷達的多機器人SLAM系統的實施和測試。論文中提出了一個系統結構來提高地下操作,其包括一個精確的基於雷達的前端以及一個靈活的魯棒的后端。

論文地址:https://arxiv.org/pdf/2003.01744v1.pdf

25.Modeling Semi-Static Scenes with Persistence Filtering in Visual SLAM26.Broadcast Your Weaknesses: Cooperative Active Pose-Graph SLAM for Multiple Robots27.FlowFusion: Dynamic Dense RGB-D SLAM Based on Optical Flow論文提出了一個新的稠密RGB-D SLAM方案,可同時實現動態/靜態分割和相機自運動估計以及靜態背景重建等工作。創新之處在於使用光流殘差在RGB-D點雲中突出顯示動態語義,並且為相機跟蹤和背景重建提供了更精確和有效的動態/靜態分割。

論文地址:https://arxiv.org/pdf/2003.05102.pdf

28.Efficient Algorithms for Maximum Consensus Robust Fitting (I)29.MulRan: Multimodal Range Dataset for Urban Place Recognition30.GPO: Global Plane Optimization for Fast and Accurate Monocular SLAM Initialization

論文研究了一種新的基於平面特征的單目SLAM初始化方法。算法從滑動窗口的單應估計開始,然后進行全局平面優化(GPO)來獲得相機位姿和平面法線,3D點的坐標可以通過平面約束實現恢復而不需要三角化。該方法充分利用了多幀的平面信息,避免了單應性分解的模糊性。

論文地址:https://arxiv.org/pdf/2004.12051.pdf

31.Large-Scale Volumetric Scene Reconstruction Using LiDAR

32.Topological Mapping for Manhattan-Like Repetitive Environments論文展示了一個具有挑戰性的室內倉庫設置的拓撲映射框架。在最抽象的層次上,倉庫被表示為一個拓撲圖,其中圖的節點表示一個特定的倉庫拓撲結構,而邊表示兩個相鄰節點或拓撲之間存在一條路徑。在中間層,該地圖被表示為一個曼哈頓圖,其中節點和邊具有曼哈頓屬性,並在最下層的細節層被表示為一個姿態圖。

論文地址:https://arxiv.org/pdf/2002.06575v3.pdf

33.Structure-Aware COP-SLAM

34.Robust RGB-D Camera Tracking Using Optimal Key-Frame Selection

35.Voxgraph: Globally Consistent, Volumetric Mapping Using Signed Distance Function Submaps

全局一致的稠密地圖是機器人在復雜環境下長時導航的關鍵要求。論文提出了一個可以在CPU上創建全局一直的體積映射的框架。所提的框架將環境表示為重疊的符號距離函數(SDF)子映射的集合,並通過計算子映射集合的最優對齊來保持全局一致性。

論文地址:https://github.com/ethz-asl/voxgraph論文地址:https://arxiv.org/pdf/2004.13154.pdf

36.DeepFactors: Real-Time Probabilistic Dense Monocular SLAM論文中提出一個SLAM系統,其利用不同的場景表示、用於優化多視圖問題的一致性度量、使用先驗學習等算法並將其同意在一個概率框架中,同時保持實時性能。論文地址:https://arxiv.org/pdf/2001.05049.pdf

37.DOOR-SLAM: Distributed, Online, and Outlier Resilient SLAM for Robotic Teams為了完成協作任務,團隊中的機器人需要對環境和它們在其中的位置有共同的理解。分布式SLAM提供了一個實用的解決方案來定位機器人,而不依賴於外部定位系統(GPS等)。論文介紹了DOOR-SLAM,一個全分布式的配備離散點提出機制的SLAM系統。DOOR-SLAM是基於peer-to-peer通信並且不需要機器人之間的完全連接。DOOR-SLAM有兩個關鍵模塊:位姿圖估計器和分布式SLAM前端。該系統已經在模擬、基准數據集和現場實驗中進行了評估,包括不支持gps的地下環境。論文地址:https://arxiv.org/pdf/1909.12198.pdf

論文地址:https://github.com/MISTLab/DOOR-SLAM.git

38.Windowed Bundle Adjustment Framework for Unsupervised Learning of Monocular Depth Estimation with U-Net Extension and Clip Loss39.StructVIO : Visual-Inertial Odometry with Structural Regularity of Man-Made Environments論文提出一個新的視覺慣性里程計方法,該算法才用了人造環境中的結構規則。論文使用Altanta世界模型而不是Manhattan世界模型描述了這種規則。

論文地址:https://arxiv.org/pdf/1810.06796.pdf

40.Flow-Motion and Depth Network for Monocular Stereo and Beyond論文提出一個基於學習的方法來解決單目立體問題,並且可以擴展到融合多目標幀的深度信息。已知來自單目相機(內參已標定)的兩張無約束圖像,論文中提出的網絡可估計相對相機位姿和源圖像的深度圖。

論文的主要貢獻有3個方面:

(1)首先,網絡是為靜態場景量身定制的,可以聯合估計光流和攝像機運動。通過聯合估計,逐漸減小光流搜索空間,實現高效准確的流估計;

(2)其次,提出了一種新的三角化層來編碼估計的光流和相機運動,同時避免了常見的由極線引起的數值問題;

(3)第三,在雙視圖深度估計的基礎上,進一步擴展了上述網絡,來融合多幅目標圖像的深度信息,得到了源圖像的深度圖。

論文地址:https://arxiv.org/pdf/1909.05452.pdf

論文地址:https://github.com/HKUST-Aerial-Robotics/Flow-Motion-Depth

41.Online LiDAR-SLAM for Legged Robots with Robust Registration and Deep-Learned Loop Closure

42.Hybrid Camera Pose Estimation with Online Partitioning for SLAM

論文提出了一種混合的實時相機位姿估計架構和一個新的分割方案,並將運動平均化到SLAM系統。該方法突破了許多常規的SLAM流程中固定大小時間划分的限制,該方法通過將空間強連接的攝像機整合到每個塊中,顯著提高了局部光束平差的精度。

論文地址:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8962959

43.Analysis of Minima for Geodesic and Chordal Cost for a Minimal 2D Pose-Graph SLAM Problem

論文中展示了對於最小2D位姿圖SLAM問題,即使在完美測量和球面協方差的理想情況下,使用geodesic距離來比較角度也會產生多個次最優局部極小值。

論文地址:https://arxiv.org/pdf/1911.05734v2.pdf

44.Voxel Map for Visual SLAM

論文認為關鍵幀不是最佳的選擇,因為一些固有的限制,如薄弱的幾何推理和較差的可擴展性。論文提出一種體素圖表示法來有效檢索視覺SLAM的地圖點。與關鍵幀相比,該方法能有效地保證被遮擋點的幾何分布,並能在一定范圍內對遮擋點進行識別和去除。論文地址:https://arxiv.org/pdf/2003.02247.pdf以上就是ICRA2020的所有SLAM部分的論文解讀,有部分論文還未正式在網上發布,因此沒有進行解讀。接下來還會推出其他部分的論文解讀,敬請期待。有感興趣的論文也可給作者留言,我們可以作出更為詳細的論文分析。

參考文獻1.https://mp.weixin.qq.com/s/n2Ssvd4PVqIPhFECbf90ag本文僅做學術分享,如有侵權,請聯系刪文。

下載1在「3D視覺工坊」公眾號后台回復:3D視覺即可下載 3D視覺相關資料干貨,涉及相機標定、三維重建、立體視覺、SLAM、深度學習、點雲后處理、多視圖幾何等方向。
下載2在「3D視覺工坊」公眾號后台回復:3D視覺優質源碼即可下載包括結構光、標定源碼、缺陷檢測源碼、深度估計與深度補全源碼、點雲處理相關源碼、立體匹配源碼、單目、雙目3D檢測、基於點雲的3D檢測、6D姿態估計源碼匯總等。
下載3在「3D視覺工坊」公眾號后台回復:相機標定即可下載獨家相機標定學習課件與視頻網址;后台回復:立體匹配即可下載獨家立體匹配學習課件與視頻網址。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM