1、KITTI數據集采集平台:
KITTI數據采集平台包括2個灰度攝像機,2個彩色攝像機,一個Velodyne 3D激光雷達,4個光學鏡頭,以及1個GPS導航系統。坐標系轉換原理參見click。KITTI提供的數據中都包含三者的標定文件,不需人工轉換。
2、KITTI數據集,label文件解析:
Car 0.00 0 -1.84 662.20 185.85 690.21 205.03 1.48 1.36 3.51 5.35 2.56 58.84 -1.75
第1個字符串:代表物體類別
'Car', 'Van', 'Truck','Pedestrian', 'Person_sitting', 'Cyclist','Tram', 'Misc' or 'DontCare'
注意:’DontCare’ 標簽表示該區域沒有被標注,比如由於目標物體距離激光雷達太遠。為了防止在評估過程中(主要是計算precision),將本來是目標物體但是因為某些原因而沒有標注的區域統計為假陽性(false positives),評估腳本會自動忽略’DontCare’ 區域的預測結果。
第2個數:代表物體是否被截斷,從0(非截斷)到1(截斷)浮動,其中truncated指離開圖像邊界的對象
第3個數:代表物體是否被遮擋,整數0,1,2,3表示被遮擋的程度
0:完全可見 1:小部分遮擋 2:大部分遮擋 3:完全遮擋(unknown)
第4個數:alpha,物體的觀察角度,范圍:-pi~pi
第5~8這4個數:物體的2維邊界框,左上角和右下角的像素坐標
第9~11這3個數:3維物體的尺寸,高、寬、長(單位:米)
第12~14這3個數:3維物體的位置 x,y,z(在照相機坐標系下,單位:米)
第15個數:3維物體的空間方向:rotation_y,在照相機坐標系下,相對於y軸的旋轉角,范圍:-pi~pi
有些有第16個數:檢測的置信度 , 僅用於結果:浮點,p / r曲線所需,越高越好
3、KITTI數據集,calib解析
要將Velodyne坐標中的點x投影到左側的彩色圖像中y:
使用公式:y = P2 * R0_rect *Tr_velo_to_cam * x
將Velodyne坐標中的點投影到右側的彩色圖像中:
使用公式:y = P3 * R0_rect *Tr_velo_to_cam * x
Tr_velo_to_cam * x :是將Velodyne坐標中的點x投影到編號為0的相機(參考相機)坐標系中
R0_rect *Tr_velo_to_cam * x :是將Velodyne坐標中的點x投影到編號為0的相機(參考相機)坐標系中,再修正
P2 * R0_rect *Tr_velo_to_cam * x :是將Velodyne坐標中的點x投影到編號為0的相機(參考相機)坐標系中,再修正,然后投影到編號為2的相機(左彩色相機)
注意:所有矩陣都存儲在主行中,即第一個值對應於第一行。 R0_rect包含一個3x3矩陣,需要將其擴展為4x4矩陣,方法是在右下角添加1,在其他位置添加0。 Tr_xxx是一個3x4矩陣(R | t),需要以相同的方式擴展到4x4矩陣!
通過使用校准文件夾中的3x4投影矩陣,可以將相機坐標系中的坐標投影到圖像中,對於提供圖像的左側彩色相機,必須使用P2。rotation_y和alpha之間的區別在於rotation_y直接在相機坐標中給出,而alpha也會考慮從相機中心到物體中心的矢量,以計算物體相對於相機的相對方向。 例如,沿着攝像機坐標系的X軸面向的汽車,無論它位於X / Z平面(鳥瞰圖)中的哪個位置,它的rotation_y都為 0,而只有當此車位於相機的Z軸上時α才為零,當此車從Z軸移開時,觀察角度α將會改變。
3、KITTI數據集,velodyne解析
即,數據被保存為.bin文件,並且,每一個點包含3個坐標和反射率信息,即(x,y,z,r),並且數據類型為浮點數類型,如下圖所示:
參考網址:
https://blog.csdn.net/cuichuanchen3307/article/details/80596689
https://blog.csdn.net/julialove102123/article/details/78432496
https://blog.csdn.net/hit1524468/article/details/79766805