Berkeley 大學最近推出的針對自動駕駛的街景數據集,號稱比 Cityscapes 數據量更大,可泛化性更好。
語義實例分割(Semantic Instance Segmentation)
數據集一共有 40 種物體類別
與 Cityscapes 的對比
街景數據來自 US 的城市
模型更熟悉美國的街景。
圖片標簽
時間:daytime, nighttime, dawn/dusk;
場景:Residential,High-way, City street, Parking lot, Gas station, Tunnel;
天氣:Clear, Partly cloudy, Over-case, Rainy, Snowy, Foggy;
Label Maps
語義分割使用標簽映射(Label Maps),不是訓練索引(Training Indices)。
更高的可泛化性
使用 Dilate Residual Network (Hyper parameter 相同)測試兩個數據集時發現下表的關系:
| Train | Test | Accuracy |
|---|---|---|
| deepDriver | deepDriver | High |
| deepDriver | Cityscapes | Low |
| Cityscapes | deepDriver | Low |
| Cityscapes | Cityscapes | High |
在同樣的數據集下訓練結果都很好,但交叉使用不同測試集時精度下降顯著。使用 deepDriver 訓練的模型在 Cityscapes 測試集上的表現雖然較差,但有部分訓練結果比在特定場景訓練的結果要好。這意味着該數據集涵蓋場景更多,訓練出的模型的可泛化性會比較好。
以上參考:https://arxiv.org/abs/1805.04687
數據集詳情
文件結構:
bdd100k
| seg
| | images
| | | train
| | | val
| | | test
| | color_labels
| | | train
| | | val
| | labels
| | | train
| | | val
檢查數據集完整性的 python3 腳本
import os
import sys
if len(sys.argv) != 2:
print ('Usage: python checkdata.py <train|val>')
exit(-1)
dataset_category = sys.argv[1]
if dataset_category not in {'train', 'val'}:
print (f'Invalid argument "{dataset_category}"')
exit(-2)
data_size = 7000 if dataset_category == 'train' else 1000
dir_root = '.'
dir_color = os.path.join(dir_root, 'color_labels', dataset_category)
dir_imgs = os.path.join(dir_root, 'images', dataset_category)
dir_label = os.path.join(dir_root, 'labels', dataset_category)
color_names = os.listdir(dir_color)
img_names = os.listdir(dir_imgs)
label_names = os.listdir(dir_label)
assert len(color_names) == len(img_names) == len(label_names) == data_size
for i in range(len(color_names)):
prefix_color = color_names[i].split('_')[0]
prefix_img = img_names[i].split('.')[0]
prefix_label = label_names[i].split('_')[0]
assert prefix_color == prefix_img == prefix_label, f'{prefix_color}, {prefix_img}, {prefix_label}'
print ('All Good!')
包含分割多邊形信息的 Json 文件目前還沒有公開,因此只能做segmentation,不能做 detection + segmentation。但是單純的 detection 數據文件已經是提供好的,可以使用查看工具查看標注矩形框和三種圖片標簽(時間、場景、天氣)

官方代碼目前的坑
https://github.com/ucbdrive/bdd-data/issues/17
https://github.com/ucbdrive/bdd-data/issues/5
https://github.com/ucbdrive/bdd-data/issues/15
其中,#15 issue 目前還未解決。
Written with StackEdit.
