MS coco中image_caption的數據格式詳解

本文轉載自查看原文 2019-12-25 21:17 1622 ImageCaptioning

coco中image_caption的數據格式,對應的文件captions_train2014.json和captions_val2014.json

1.使用json加載文件

對應的解析代碼如下：

import json
if __name__=='__main__':
    base_path = r'/data/antonio/images_data/images/annotations/captions_train2014.json'

    image_caption={}
    with open(base_path,'r') as f:
        dataset=json.load(f)
    image_caption['annotations'] = []
    for data in dataset['annotations']:
        image_caption['annotations'].append({})
        for key in data:
            image_caption['annotations'][0][key]=data[key]
        break

    image_caption['images'] = []
    for data in dataset['images']:
        image_caption['images'].append({})
        for key in data:
            image_caption['images'][0][key]=data[key]
        break

    image_caption['info'] = {}
    for key in dataset['info']:     #dict
        image_caption['info'][key]=dataset['info'][key]

    image_caption['licenses'] = []
    for data in dataset['licenses']: #2014 have eight list
        image_caption['licenses'].append({})
        for key in data:
            image_caption['licenses'][0][key]=data[key]
        break
    print(image_caption)

用json加載之后內容如下：

只顯示列表中元素的第一個元素，annotations是list，存儲的是字典，字典有三個鍵-值對，對應如下：

{
    'annotations': [{
            'image_id': 318556,#唯一的圖片ID，此ID同時是圖像文件名的序列號，對應的文件名：COCO_train2014_000000318556.jpg
            'id': 48, # 唯一的對象ID
            'caption': 'A very clean and well decorated empty bathroom'
        }
        ...
        ...
    ],
    'images': [{
            'license': 5,
            'date_captured': '2013-11-14 16:28:13',
            'flickr_url': 'http://farm4.staticflickr.com/3153/2970773875_164f0c0b83_z.jpg',
            'coco_url': 'http://images.cocodataset.org/train2014/COCO_train2014_000000057870.jpg',
            'id': 57870 #此id對應的是'annotations'中的image_id
            'width': 640,
            'file_name': 'COCO_train2014_000000057870.jpg',
            'height': 480
        }
        ...
        ...
    ],
    'licenses': [{
            'id': 1,
            'url': 'http://creativecommons.org/licenses/by-nc-sa/2.0/',
            'name': 'Attribution-NonCommercial-ShareAlike License'
        }
        ...
        ...
    ],
    'info': {
        'description': 'COCO 2014 Dataset',
        'year': 2014,
        'date_created': '2017/09/01',
        'contributor': 'COCO Consortium',
        'url': 'http://cocodataset.org',
        'version': '1.0'
    }
}

2. 如果用微軟提供的pycocotools.coco加載json文件

對應的代碼：

from pycocotools.coco import COCO
import torch.utils.data as data
import json
class DataLoader(data.Dataset):
    def __init__(self, json,  transform=None):
        self.coco = COCO(json)
        self.ids = list(self.coco.anns.keys())
        self.transform = transform



if __name__=='__main__':
    base_path = r'/data/antonio/images_data/images/annotations/captions_train2014.json'
    dataloader = DataLoader(base_path)

對應的dataset存放的json文件中的數據，其他部分是COCO處理得到

其中imgToAnns是image_id對應的5個caption

其中anns是id為key的字典，對應的value仍然是字典，字典中存儲的是image_id，id，caption

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 MS COCO數據標注詳解 MS coco數據集下載 Python---json數據格式詳解 oracle中的日期類型的數據格式 JSON數據格式 layui數據格式 YUV的數據格式 JSON數據格式 MS COCO 數據集學習筆記（Common Objects in COntext） Gson，FastJson，JackJson，ProtoBuf 數據格式轉換詳解