Введение
PASCAL VOC
(The PASCAL Visual Object Classes
) — это соревнование по компьютерному зрению мирового класса, первое соревнование которого состоялось в 2005 году, а в последующие годы — до последнего — в 2012 году.PASCAL
Полное имяPattern Analysis, Statistical modelling and ComputAtional Learning
, официальный адрес г.host.robots.ox.ac.uk/pascal/VOC/
PASCAL VOC
предоставляет набор стандартизированных наборов данных для распознавания и классификации изображений для создания и оценки классификации изображений (Classification
),Обнаружение цели(Object Detection
) и разделить (Segmentation
) алгоритм, мы знакомы с моделями компьютерного зрения, такими какR-CNN
ряд,SSD
иYOLO
и т.д. основаны наPASCAL VOC
запущен на наборе данных
На данный момент наиболее полный набор данныхPASCAL VOC 2012
наборы данных, в то время как большинство исследователей обычно используютPASCAL VOC 2007
иPASCAL VOC 2012
Эти два набора данных являются взаимоисключающими и несовместимыми.PASCAL VOC 2012
Всего включено 20 типов объектов,train
иval
Имеется 11530 изображений с 27450 метками обнаружения объектов и 6929 метками сегментации.
На следующем рисунке показаны категории набора данных и их иерархическая структура.
Эта структура не менялась с 2007 года.
Организация набора данных
После того, как набор данных загружен и распакован, файловая структура выглядит так:
├── Annotations 标签文件,xml格式
├── ImageSets 存放数据集的分割文件
├── JPEGImages 图片文件,jpg格式
├── SegmentationClass 存放按照class类别分割的图片
└── SegmentationObject 存放按照object目标分割的图片
вAnnotations
папка
├── 000001.xml
├── 000002.xml
├── 000003.xml
...
типичныйxml
Файл этикетки выглядит следующим образом
Значение каждого поля
-
folder
: владение папкой -
filename
:имя файла -
database
: имя базы данных -
annotation
: Формат файла тега -
size
: Размер изображения,width
ширина,height
высокий,depth
количество каналов -
segmented
:сегментация -
object
: представляет цель,name
название ярлыка,pose
угол камеры, даfront
,rear
,left
,right
иunspecified
,truncated
Является ли оно усеченным, то есть содержит ли изображение полную цель,difficult
Сложность обнаружения, 1 означает да, 0 означает нет -
bndbox
: местоположение цели, использоватьxmin
,ymin
,xmax
,ymax
Представлять
ImageSets
Папка, в которой хранятся разделенные файлы набора данных, содержит три подпапки.Action
,Layout
,Main
иSegmentation
,вAction
Папки используются для файлов распознавания движения,Main
В папке хранятся файлы сегментации набора данных для классификации и обнаружения.Layout
папка дляperson layout
Задача,Segmentation
для задач сегментации
Критерии оценки
PASCAL VOC
Критерии оценкиmAP
(mean Average Precision
), что касаетсяmAP
, ПреамбулаТочность, отзыв, IoU и картаЭто было объяснено, если вам непонятно, вы можете пойти и посмотреть
PASCAL
Официальная оценкаmAP
Скрипт и пример кода, адрес для скачивания:host.robots.O.AC.UK/Pascal/VOC/…, но код используетmatlab
написано
получить набор данных
PASCAL VOC2007
Ссылка на сайт:disk.baidu.com/is/1-0U9i_XB…
Код извлечения:zmz6
PASCAL VOC2012
Ссылка на сайт:disk.baidu.com/is/1CJ на 12 В…
Код извлечения:1340