https://www.bilibili.com/video/BV1aE411T7Gf/?spm_id_from=333.788.recommend_more_video.15





2D識別/j檢測/分割的缺點:不知道檢測出來的人離自己或者機器有多遠。理想的情況是讓機器感知到3D世界,並做一定的交互。


人能感知到3維世界,但是機器不行。
人看兔子是有3維形狀的,但是機器只認為它是一連串的點。
3d點雲的優點是含有幾何信息。采集是數據不受光照的影響,這一點和Image是有區別的。
缺點或者說挑戰:
1.不規則,近密遠疏。不想image那樣,按照pixel有規則的排列。
2. 無序。打亂后,還是表示同一個對象,但是計算機這時候認為不是一個對象了,因為點的矩陣不一樣了。








semantic segmentation是把一個場景中所有的椅子輸出為一個標簽,instance segmentation在所有椅子輸出一個標簽的基礎上,還是把每一把椅子區分開,每一把椅子都要有不同的標簽,是更加細粒度的語義識別,更加高層次的一個理解。
























目前3d點雲的實例分割還沒有Pipeline.

