1.背景
1.1 高精資料采集
高精采集車是集成了測繪激光、高性能慣導、高分辨率相機等傳感器為一體的移動測繪系統。高德高精團隊經過多年深耕打造的采集車,具有精度高、速度快、數據產生周期短、自動化程度高、安全性高、信息量大等特點。
為了保證高精地圖制作的精度,在高精采集車中,我們使用了目前業界最先進的激光測距儀,具有測量距離遠、點雲密度大等優點,掃描頻率可以達到每秒100萬點。
1.2 激光MTA問題
高速的掃描頻率帶來高質量數據的同時,也引入了一些特有的噪聲和干擾,MTA就是其中的一種。什么是
MTA(Multi-Time-Around)呢?我們可以看一下圖1,通過上下兩圖的對比可以看到,MTA問題實際就是激光的測距問題,激光將遠處的點錯誤的拉到了近處,導致遠處的樓房成為了近處路面上的噪聲。
MTA問題會給后續資料處理、自動識別、地圖制作等工藝流程帶來很大的困難,導致識別以及人工流程出現錯誤。
我們需要通過激光的內部機制和數據處理算法,將這些噪聲恢復到它本來的位置。本文會從
MTA問題產生的原理、
激光應對MTA的內部機制、
數據處理算法三方面來介紹高精資料處理是如何解決這個問題的。

圖1 MTA問題數據
2.MTA原理
那么,MTA究竟是怎樣產生的呢?這要從激光的測量原理說起。
2.1 激光測距原理
典型的激光掃描儀是采用
TOF(time of flight)原理進行測量的,即激光傳感器在測量時每隔固定時間發射一個脈沖,然后測量返回的脈沖能量,根據發射和接收的時間差計算點的距離:

通過周期性地“發射激光-接收回波”,即可根據光飛行參數得到一系列測量點距離,結合激光自身的位置和姿態即可計算出反射點的位置。
2.2 MTA多區間
激光受自身功率的限制,通常能夠探測到的最遠物體距離有限,為Dmax。而激光脈沖的發射間隔為dt,在下一個脈沖發射前,當前激光脈沖能夠探測到的最遠距離為:

高精采集車使用的激光頻率為100萬點/秒,對應的Dpluse為150m。
通常情況下,激光的發送和接收是按順序進行的,即發送-接收-發送-接收,空中始終只有一個激光脈沖,接收和發送是一一匹配的。
但是,當Dmax大於Dpluse時,如果測量物體比較遠,就可能在空中出現多個脈沖,多個脈沖到達接收器的順序不再和脈沖發射的順序一致,接收器無法正確計算脈沖的TOF,從而不能正確的得出物體的測距。這就是MTA(Multi-Time-Around),如下圖2所示。
通常將反射信號可能跨過的收發周期數稱為“MTA區間”,匹配時間上最近的一個發射信號為MTA1,次近的發射信號為MTA2…依此類推。
Dpluse就是每個MTA的區間長度。如果物體離激光的距離超過這個長度,就會發生MTA問題,高精采集車激光的MTA區間長度是150m,因此對於超過150m的遠處高樓就發生了MTA現象。

圖2 MTA區間
3.激光應對MTA的內部機制
為了應對MTA問題,激光廠家也做了一些努力,通過利用測量物體的表面連續性的假設和變周期測量技術,找到了一些解決思路。
3.1 鄰域連續性假設
在現實世界中大多數物體,例如道路、標牌、建築物等人造物,這些實物都具有表面連續性,一般不會出現劇烈的幾何變化和紋理。因此,連續的激光脈沖測距應該變化不大,如圖3所示。
如果能夠找到一種辦法,使得當激光測距放錯MTA區間時,相鄰激光點不再具有連續性的特征,就可以將點雲放到正確的MTA區間。變周期測量技術就是基於這一思路而產生的。

圖3 相鄰激光點測距連續性
3.2 變周期測量技術
為了識別MTA問題,激光廠商設計了一系列專利技術,其核心是“激光發射間隔可變”,即相鄰激光脈沖發射的時間間隔是不同的,如圖4。而且這個發射間隔的變化具備周期性,其周期特點如圖5所示。當將點雲放錯MTA區間時,其測距不再是連續的,而是如圖5中列表第3列所示,來回跳躍。如圖6,錯誤的MTA區間,相鄰點來回跳躍,形成圖中的分層。

圖4 變周期發射技術

圖5 變周期參數

圖6 錯誤MTA區間
4.MTA修正算法
根據MTA問題的原理以及鄰域連續性假設,結合硬件上的變周期測量技術,確定MTA問題處理方案。首先進行鄰域划分,找到相鄰激光點,然后對相鄰點計算放到不同MTA區間的統計權值,權值大的為真實MTA區間。同時為了提高算法性能,利用激光本身安裝位置參數避免不必要的權值計算。
4.1 鄰域設置與檢測
首先確定鄰域,因為Lidar是一圈圈掃描的,既要考慮時間上連續的點相鄰,也要考慮連續圈的相鄰。其基本思路如下:
- 數據分圈:以一個圓周(線)為基本處理單元;
- 連續性計算區域:對於某個點,取其當前圈的鄰近點以及前后相鄰兩圈的鄰近點作為連續性計算區域,如圖7;
- 對每個點計算其測距連續性權值以及反射率連續性權值,即與方差成反比例然后得出MTA區域。

圖7 鄰域查找
4.2 加權統計策略
總的加權策略是距離方差越大,權重越小;反射率方差越大,權重越小。具體權值選擇采用高斯函數或三角函數。
經過實際大批量數據統計分析,距離方差的權重采用高斯函數,其中u=0,δ=0.25,反射率方差的權重也采用高斯函數,其中u=0,δ=4

圖8 加權函數選取
具體計算過程如下:
- 對每個點,分別獲取其作為MTA1與MTA2的測量數據,主要為測距值、反射率;
- 對每個點,分別獲取其MTA1與MTA2鄰居點集合;
- 計算每個點的每個鄰居的測距權值和反射率權值,然后求和,最終根據權值大小確定MTA區域。
4.3 處理效果
算法的處理效果如下圖9,圖10.

圖9 MTA處理效果:未處理MTA

圖10 MTA處理效果:MTA恢復結果
4.4 性能優化
使用基本的處理方案可以較好地恢復MTA錯誤問題,但是由於搜索區間較大,而且必須逐點處理,效率很低,不能滿足效率的要求,需要進行優化。考慮的優化方向包括減少搜索區間和算法優化兩方面。
4.4.1 減小搜索區間
我們使用的激光設備探測范圍參數如下,不超過300m,也就是2個MTA區間,因此可以只考慮MTA1和MTA2區間兩種可能,這就大大降低了計算量。
設備探測范圍參數:
- 探測距離最大 235m(80%高反射率);
- 低反射率物體不到 100m;
- 針葉林 100m;
- 柏油瀝青 120m;
- 闊葉林 150m;
- 建築磚頭 200m左右;
- 白色灰泥 250m。
4.4.2 算法優化
根據掃描特性進一步進行算法優化。
- 考慮到發生MTA錯誤都發生在地面以上,即激光實際能掃描到的很遠的物體都在地面以上,可先根據車高信息剔除地面附近點;
- 對於多次回波,點的連續性只取第一次回波來計算;
- 分圈后按掃描角和測距值判斷空間相鄰;
- 分圈處理,多線程並行加速;
- 對於不同區域的連續性都很差的點作為孤立點進行剔除。
5.總結與展望
MTA處理算法作為點雲解算模塊的一部分,是采集資料處理上雲的重要環節,不解決MTA問題,就無法實現采集資料處理的自動化。同時MTA處理算法去除了資料處理環節對激光廠商軟件的依賴,為公司節省了大量成本。
在算法設計階段嘗試利用SVM,RF等機器學習手段按點雲分類思路解題,初步測試發現樣本制作困難、正負樣本量級差異過大等問題。另一方面,機器學習方法批次處理需要考慮合適的空間范圍,對於每個分塊動輒億級的點數,其處理效率將無法滿足產線需求。
在算法效果評估階段,原本打算使用廠商處理的結果作為真值。但評測下來發現,廠商處理結果的效果不如自研算法,不能作為評測真值。最終我們結合產線工藝需求,專門制作了評估方案,算法目標對焦到業務需求,從而客觀、可靠、快速地完成了算法的評測工作。
目前MTA處理算法已經進入了線上生產,處理了上萬公里點雲數據,目前運行穩定,達到預期。
關於高精地圖業務中心
高精地圖是高德
最具創新性的業務之一,致力於用傳感器丈量世界,用算法理解世界,用數據重新定義世界。我們幾乎涵蓋最熱門前沿學科,
高精地圖和自動駕駛是多學科交叉的應用工程體系。基於感知理解,三維重建,融合定位,計算幾何技術自動化生成高精數字化三維地圖。利用邊緣計算,大數據處理,雲服務,進行實時海量數據地圖重建。通過5G/V2X信息交換,實現地圖對象間的數據互通,構建一張活地圖。我們不僅僅是數據制作者,更是新生活的定義者。加入我們,未來“由”你。
