深度學習LiDAR定位：L3-Net

本文轉載自查看原文 2020-05-04 07:22 972

深度學習LiDAR定位：L3-Net

摘要

本文提出L3-Net——一種新穎的基於學習的LiDAR定位系統，可實現厘米級的定位，與現有最高水平的傳統定位算法相媲美。與傳統定位算法不同，本文創新地實現了使用各種深度神經網絡結構來建立基於學習的定位算法。首先，L3-Net會學習專門針對不同現實駕駛場景中的匹配而優化的局部描述，在解決方案空間中建立的成本量上的3D卷積顯著提高了定位精度。其次，使用RNN對車輛動力學進行建模，從而獲得更好的時間平滑度和准確性。然后，本文使用新收集的數據集全面驗證了L3-Net的有效性。最后，本文使用了具有挑戰的SunnyvaleBigLoop序列(在采集的地圖和測試數據之間間隔了一年時間的序列)進行測試，測試結果表明，L3-Net在這些數據集中具有很低的定位誤差，證明了其在實際工業實現中的成熟度。

背景及問題描述

傳統LiDAR定位算法流程與基於學習的定位算法流程對比如圖1所示。其中，傳統算法的步驟通常是：特征描述（如點、平面、桿、2D柵格上基於高度的高斯特征等）、地圖匹配、匹配誤差的計算、空間搜索或優化（如全搜索或由粗到精的搜索，蒙特卡洛采樣或迭代梯度下降最小化）。這些傳統算法中，通常需要利用點雲的幾何特征、反射強度特征來進行配准或濾波，實現定位。常見的有基於ICP、NDT、直方圖濾波、卡爾曼濾波等的定位算法。盡管其中一些算法具有不同場景下出色的准確性和魯棒性，但通常需要大量的工程工作來調優流程中的每個模塊，並設計硬編碼的特征和匹配方法。此外，這些傳統定位算法的系統類型對運行場景有很強的偏好。要使一個通用的定位系統能夠適應所有具有挑戰性的場景需要巨大的工程努力，這通常是極其困難的。

圖 1 傳統與基於學習的定位算法流程圖

而基於學習的方法以數據驅動的方式為上述問題的解決開辟了一條全新的道路。

主要貢獻

（1）根據作者了解，這是當時第一個基於學習的，用於自動駕駛的LiDAR定位框架，可直接處理點雲並准確估計車輛的位置和方向，並能得到與當時最好的算法相媲美的效果。

（2）創新性的使用3D卷積學習如何調整x，y，yaw這三個維度上的匹配代價以提高定位精度

（3）將提出的算法在同一條道路上在不同時間進行了多次試驗，並在各種城市道路上進行嚴格的測試；發布數據集，數據集包含超過380公里的真實交通駕駛場景的數據，適合定位任務。

主要原理及思路

L3-Net主要由Keypoint Selection、Descriptor Extraction、Cost Volume and 3D CNNs、Probability Offset Volume、以及Temporal Smoothness五個部分組成。輸入為已構建的點雲地圖和行駛時的LiDAR觀測數據。接下來分五個部分分別描述L3-Net的細節。L3-Net網絡架構如圖2所示：