[論文筆記]RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds


 

 

 


針對目前點雲分割存在速度慢、顯存需求大的問題,該文提出以一種高效率學習的方法。從論文的結果來看,該文不僅在計算時間和計算資源上大幅縮減,分割效果也是達到甚至超過了SOTA。

采樣

大規模點雲處理的一個挑戰在於如何快速且有效地進行采樣,從而加速應用所需的時間和計算資源。針對這個問題,本文的一個貢獻在於比對了現有方法的效率,結論是盡管最遠點采樣是最流行的作法,但是對於LiDAR數據,每一幀上萬個點需要處理,隨機采樣是最適合的,速度快並且performance也不錯。但是隨機采樣可能會丟失重要的點,所以作者提出Local Feature Aggregation。

 Local Feature Aggregation

該部分能並行處理點,包含三個units:1) local spatial encoding (LocSE), 2) attentive pooling, and 3) dilated residual block.

Local Spatial Encoding

對於每個采樣點,在原所有點雲中找其KNN個臨近點(歐氏距離);再將該點和臨近點以及他們之間的差concatenate並用MLP學習得到相對位置

 

 每個采樣點得到相對位置后,將其和該點的特征concate,得到該點的一系列最終的增強采樣點,組成一個向量。

Attentive Pooling

用attention的方式取代max/mean pooling進行特征融合

Dilated Residual Block

多層疊加

 整個網絡結構

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM