Формат аннотации набора данных MSCOCO (cocodataset.org), структура данных выглядит следующим образом
{
"images":
[
{"file_name":"cat.jpg", "id":1, "height":1000, "width":1000},
{"file_name":"dog.jpg", "id":2, "height":1000, "width":1000},
...
]
"annotations":
[
{"image_id":1, "bbox":[100.00, 200.00, 10.00, 10.00], "category_id": 1}
{"image_id":2, "bbox":[150.00, 250.00, 20.00, 20.00], "category_id": 2}
...
]
"categories":
[
{"id":0, "name":"bg"}
{"id":1, "name":"cat"}
{"id":1, "name":"dog"}
...
]
}
В файле аннотации ключевое слово «images» соответствует информации об изображении, ключевое слово «annotations» соответствует информации аннотации, а «categories» соответствует информации категории:
"images":В данных, соответствующих этому ключевому слову, каждый элемент соответствует изображению, «имя_файла» соответствует имени изображения, «id» соответствует порядковому номеру изображения, а «высота» и «ширина» соответствуют высоте и ширине изображения. изображение соответственно.
"annotations":В данных, соответствующих ключевому слову, каждый элемент соответствует метке, «image_id» соответствует серийному номеру изображения, а «bbox» соответствует прямоугольнику метки в порядке [x, y, w, h], которые начальные точки прямоугольника: координата x, координата y начальной точки, ширина и высота. "category_id" соответствует порядковому номеру категории.
"categories":В данных, соответствующих ключевому слову, каждый элемент соответствует категории, «id» соответствует порядковому номеру категории, а «name» соответствует имени категории.
Описание ассоциации ключевых слов:
1. Элементы в «аннотациях» связаны с изображениями по «image_id», например «image_id»: 2. Эта часть аннотационной информации соответствует изображению с «id» 2 в «images».
2. Элементы в «аннотациях» связаны с категориями по «category_id», например, «category_id»: 2, информация аннотации соответствует категории, чей «id» равен 2 в «categories».
пример:в структуре данных, указанной выше
{"image_id":1, "bbox":[100.00, 200.00, 10.00, 10.00], "category_id": 1}
Эта аннотационная информация может найти соответствующее изображение от «cat.jpg» до «image_id», а соответствующую категорию можно найти от «cat» до «category_id».
Описание фонового изображения:
Элемент в «аннотациях», «category_id»: 0 соответствует фону. Если и только если «category_id» равен 0 во всех аннотациях, соответствующих изображению, изображение является фоновым изображением.