Внедрение формата набора данных кокоса для обнаружения цели «Глубокое приложение»

искусственный интеллект глубокое обучение

Формат аннотации набора данных MSCOCO (cocodataset.org), структура данных выглядит следующим образом

{
	"images":
		[
			{"file_name":"cat.jpg", "id":1, "height":1000, "width":1000},
			{"file_name":"dog.jpg", "id":2, "height":1000, "width":1000},
			...
		]
	"annotations":
		[
			{"image_id":1, "bbox":[100.00, 200.00, 10.00, 10.00], "category_id": 1}
			{"image_id":2, "bbox":[150.00, 250.00, 20.00, 20.00], "category_id": 2}
			...
		]
	"categories":
		[
			{"id":0, "name":"bg"}
			{"id":1, "name":"cat"}
			{"id":1, "name":"dog"}
			...
		]
}

В файле аннотации ключевое слово «images» соответствует информации об изображении, ключевое слово «annotations» соответствует информации аннотации, а «categories» соответствует информации категории:
"images":В данных, соответствующих этому ключевому слову, каждый элемент соответствует изображению, «имя_файла» соответствует имени изображения, «id» соответствует порядковому номеру изображения, а «высота» и «ширина» соответствуют высоте и ширине изображения. изображение соответственно.
"annotations":В данных, соответствующих ключевому слову, каждый элемент соответствует метке, «image_id» соответствует серийному номеру изображения, а «bbox» соответствует прямоугольнику метки в порядке [x, y, w, h], которые начальные точки прямоугольника: координата x, координата y начальной точки, ширина и высота. "category_id" соответствует порядковому номеру категории.
"categories":В данных, соответствующих ключевому слову, каждый элемент соответствует категории, «id» соответствует порядковому номеру категории, а «name» соответствует имени категории.

Описание ассоциации ключевых слов:
1. Элементы в «аннотациях» связаны с изображениями по «image_id», например «image_id»: 2. Эта часть аннотационной информации соответствует изображению с «id» 2 в «images».
2. Элементы в «аннотациях» связаны с категориями по «category_id», например, «category_id»: 2, информация аннотации соответствует категории, чей «id» равен 2 в «categories».

пример:в структуре данных, указанной выше

{"image_id":1, "bbox":[100.00, 200.00, 10.00, 10.00], "category_id": 1}

Эта аннотационная информация может найти соответствующее изображение от «cat.jpg» до «image_id», а соответствующую категорию можно найти от «cat» до «category_id».

Описание фонового изображения:
Элемент в «аннотациях», «category_id»: 0 соответствует фону. Если и только если «category_id» равен 0 во всех аннотациях, соответствующих изображению, изображение является фоновым изображением.