Введение
PASCAL VOC(The PASCAL Visual Object Classes) — это соревнование по компьютерному зрению мирового класса, первое соревнование которого состоялось в 2005 году, а в последующие годы — до последнего — в 2012 году.PASCALПолное имяPattern Analysis, Statistical modelling and ComputAtional Learning, официальный адрес г.host.robots.ox.ac.uk/pascal/VOC/
PASCAL VOCпредоставляет набор стандартизированных наборов данных для распознавания и классификации изображений для создания и оценки классификации изображений (Classification),Обнаружение цели(Object Detection) и разделить (Segmentation) алгоритм, мы знакомы с моделями компьютерного зрения, такими какR-CNNряд,SSDиYOLOи т.д. основаны наPASCAL VOCзапущен на наборе данных
На данный момент наиболее полный набор данныхPASCAL VOC 2012наборы данных, в то время как большинство исследователей обычно используютPASCAL VOC 2007иPASCAL VOC 2012Эти два набора данных являются взаимоисключающими и несовместимыми.PASCAL VOC 2012Всего включено 20 типов объектов,trainиvalИмеется 11530 изображений с 27450 метками обнаружения объектов и 6929 метками сегментации.
На следующем рисунке показаны категории набора данных и их иерархическая структура.
Эта структура не менялась с 2007 года.
Организация набора данных
После того, как набор данных загружен и распакован, файловая структура выглядит так:
├── Annotations 标签文件,xml格式
├── ImageSets 存放数据集的分割文件
├── JPEGImages 图片文件,jpg格式
├── SegmentationClass 存放按照class类别分割的图片
└── SegmentationObject 存放按照object目标分割的图片
вAnnotationsпапка
├── 000001.xml
├── 000002.xml
├── 000003.xml
...
типичныйxmlФайл этикетки выглядит следующим образом
Значение каждого поля
-
folder: владение папкой -
filename:имя файла -
database: имя базы данных -
annotation: Формат файла тега -
size: Размер изображения,widthширина,heightвысокий,depthколичество каналов -
segmented:сегментация -
object: представляет цель,nameназвание ярлыка,poseугол камеры, даfront,rear,left,rightиunspecified,truncatedЯвляется ли оно усеченным, то есть содержит ли изображение полную цель,difficultСложность обнаружения, 1 означает да, 0 означает нет -
bndbox: местоположение цели, использоватьxmin,ymin,xmax,ymaxПредставлять
ImageSetsПапка, в которой хранятся разделенные файлы набора данных, содержит три подпапки.Action,Layout,MainиSegmentation,вActionПапки используются для файлов распознавания движения,MainВ папке хранятся файлы сегментации набора данных для классификации и обнаружения.Layoutпапка дляperson layoutЗадача,Segmentationдля задач сегментации
Критерии оценки
PASCAL VOCКритерии оценкиmAP(mean Average Precision), что касаетсяmAP, ПреамбулаТочность, отзыв, IoU и картаЭто было объяснено, если вам непонятно, вы можете пойти и посмотреть
PASCALОфициальная оценкаmAPСкрипт и пример кода, адрес для скачивания:host.robots.O.AC.UK/Pascal/VOC/…, но код используетmatlabнаписано
получить набор данных
PASCAL VOC2007
Ссылка на сайт:disk.baidu.com/is/1-0U9i_XB…
Код извлечения:zmz6
PASCAL VOC2012
Ссылка на сайт:disk.baidu.com/is/1CJ на 12 В…
Код извлечения:1340