初涉 Deep Drive Dataset


Berkeley 大學最近推出的針對自動駕駛的街景數據集,號稱比 Cityscapes 數據量更大,可泛化性更好。

語義實例分割(Semantic Instance Segmentation)

數據集一共有 40 種物體類別

與 Cityscapes 的對比

街景數據來自 US 的城市

模型更熟悉美國的街景。

圖片標簽

時間:daytime, nighttime, dawn/dusk;
場景:Residential,High-way, City street, Parking lot, Gas station, Tunnel;
天氣:Clear, Partly cloudy, Over-case, Rainy, Snowy, Foggy;

Label Maps

語義分割使用標簽映射(Label Maps),不是訓練索引(Training Indices)。

更高的可泛化性

使用 Dilate Residual Network (Hyper parameter 相同)測試兩個數據集時發現下表的關系:

Train Test Accuracy
deepDriver deepDriver High
deepDriver Cityscapes Low
Cityscapes deepDriver Low
Cityscapes Cityscapes High

在同樣的數據集下訓練結果都很好,但交叉使用不同測試集時精度下降顯著。使用 deepDriver 訓練的模型在 Cityscapes 測試集上的表現雖然較差,但有部分訓練結果比在特定場景訓練的結果要好。這意味着該數據集涵蓋場景更多,訓練出的模型的可泛化性會比較好。

以上參考:https://arxiv.org/abs/1805.04687

數據集詳情

文件結構:

bdd100k
|   seg
|    |  images 
|    |    |  train
|    |    |  val
|    |    |  test
|    |  color_labels
|    |    |  train
|    |    |  val
|    |  labels
|    |    |  train
|    |    |  val

檢查數據集完整性的 python3 腳本

import os
import sys 

if  len(sys.argv) !=  2:
	print ('Usage: python checkdata.py <train|val>')
	exit(-1)

dataset_category = sys.argv[1]
if dataset_category not  in {'train', 'val'}:
	print (f'Invalid argument "{dataset_category}"')
	exit(-2)

data_size = 7000 if dataset_category == 'train' else 1000

dir_root =  '.'
dir_color = os.path.join(dir_root, 'color_labels', dataset_category)
dir_imgs = os.path.join(dir_root, 'images', dataset_category)
dir_label = os.path.join(dir_root, 'labels', dataset_category)

color_names = os.listdir(dir_color)
img_names = os.listdir(dir_imgs)
label_names = os.listdir(dir_label)

assert len(color_names) ==  len(img_names) ==  len(label_names) == data_size

for i in range(len(color_names)):
	prefix_color = color_names[i].split('_')[0]
	prefix_img = img_names[i].split('.')[0]
	prefix_label = label_names[i].split('_')[0]
	assert prefix_color == prefix_img == prefix_label, f'{prefix_color}, {prefix_img}, {prefix_label}'

print ('All Good!')

包含分割多邊形信息的 Json 文件目前還沒有公開,因此只能做segmentation,不能做 detection + segmentation。但是單純的 detection 數據文件已經是提供好的,可以使用查看工具查看標注矩形框和三種圖片標簽(時間、場景、天氣)

官方代碼目前的坑

https://github.com/ucbdrive/bdd-data/issues/17
https://github.com/ucbdrive/bdd-data/issues/5
https://github.com/ucbdrive/bdd-data/issues/15
其中,#15 issue 目前還未解決。


Written with StackEdit.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM