Набор данных PASCAL VOC | Августовское обновление

глубокое обучение

Введение

PASCAL VOC(The PASCAL Visual Object Classes) — это соревнование по компьютерному зрению мирового класса, первое соревнование которого состоялось в 2005 году, а в последующие годы — до последнего — в 2012 году.PASCALПолное имяPattern Analysis, Statistical modelling and ComputAtional Learning, официальный адрес г.host.robots.ox.ac.uk/pascal/VOC/

PASCAL VOC

PASCAL VOC

PASCAL VOC

PASCAL VOCпредоставляет набор стандартизированных наборов данных для распознавания и классификации изображений для создания и оценки классификации изображений (Classification),Обнаружение цели(Object Detection) и разделить (Segmentation) алгоритм, мы знакомы с моделями компьютерного зрения, такими какR-CNNряд,SSDиYOLOи т.д. основаны наPASCAL VOCзапущен на наборе данных

На данный момент наиболее полный набор данныхPASCAL VOC 2012наборы данных, в то время как большинство исследователей обычно используютPASCAL VOC 2007иPASCAL VOC 2012Эти два набора данных являются взаимоисключающими и несовместимыми.PASCAL VOC 2012Всего включено 20 типов объектов,trainиvalИмеется 11530 изображений с 27450 метками обнаружения объектов и 6929 метками сегментации.

На следующем рисунке показаны категории набора данных и их иерархическая структура.

PASCAL VOC

Эта структура не менялась с 2007 года.

Организация набора данных

После того, как набор данных загружен и распакован, файловая структура выглядит так:

├── Annotations 标签文件,xml格式
├── ImageSets 存放数据集的分割文件
├── JPEGImages 图片文件,jpg格式
├── SegmentationClass 存放按照class类别分割的图片
└── SegmentationObject 存放按照object目标分割的图片

вAnnotationsпапка

├── 000001.xml
├── 000002.xml
├── 000003.xml
...

типичныйxmlФайл этикетки выглядит следующим образом

PASCAL VOC

Значение каждого поля

  • folder: владение папкой
  • filename:имя файла
  • database: имя базы данных
  • annotation: Формат файла тега
  • size: Размер изображения,widthширина,heightвысокий,depthколичество каналов
  • segmented:сегментация
  • object: представляет цель,nameназвание ярлыка,poseугол камеры, даfront,rear,left,rightиunspecified,truncatedЯвляется ли оно усеченным, то есть содержит ли изображение полную цель,difficultСложность обнаружения, 1 означает да, 0 означает нет
  • bndbox: местоположение цели, использоватьxmin,ymin,xmax,ymaxПредставлять

ImageSetsПапка, в которой хранятся разделенные файлы набора данных, содержит три подпапки.Action,Layout,MainиSegmentationActionПапки используются для файлов распознавания движения,MainВ папке хранятся файлы сегментации набора данных для классификации и обнаружения.Layoutпапка дляperson layoutЗадача,Segmentationдля задач сегментации

Критерии оценки

PASCAL VOCКритерии оценкиmAP(mean Average Precision), что касаетсяmAP, ПреамбулаТочность, отзыв, IoU и картаЭто было объяснено, если вам непонятно, вы можете пойти и посмотреть

PASCALОфициальная оценкаmAPСкрипт и пример кода, адрес для скачивания:host.robots.O.AC.UK/Pascal/VOC/…, но код используетmatlabнаписано

получить набор данных

PASCAL VOC2007

Ссылка на сайт:disk.baidu.com/is/1-0U9i_XB…
Код извлечения:zmz6

PASCAL VOC2012

Ссылка на сайт:disk.baidu.com/is/1CJ на 12 В…
Код извлечения:1340

использованная литература