Набор данных классификации видео "Deep Data"·HMDB51 Введение

искусственный интеллект глубокое обучение

0. Фон

Основные наборы данных классификации видео представлены в таблице:

 

В этой статье подробно представлен небольшой и простой в использовании набор данных HMDB51, который содержит небольшой объем данных и прост в использовании.

 

1. Введение HMDB51

HMDB51 содержит 51 тип действий, всего 6849 видео, каждое действие содержит не менее 51 видео, разрешение 320*240. С ютуба, гугл видео и т.д. итого 2G.

Адрес главной страницы:Изредка хот-спикер. В дополнение к обычному. Коричневый. Квота/ресурс/ пока нет…
Рекомендуется использовать загрузку Thunder в Китае, скорость выше.

Действия в основном включают:

1) Общие мимические движения улыбка, смех, жевание, разговор.

2) Манипуляции с лицом и манипулирование объектами: курение, еда, питье.

3) Общие движения тела: колёса, хлопки в ладоши, лазание, подъем по лестнице, прыжки, приземление на пол, сальто наотмашь, стойки на руках, прыжки, подтягивания, толчки, бег, приседание, приседание, кувырки, вставание, повороты, ход. , волна.

4) Взаимодействие с объектами: расчесывание волос, хватание, вытаскивание мечей, ведение мяча, игра в гольф, удары по предметам, мячи, сбор, подбрасывание, толкание предметов, езда на велосипеде, верховая езда, стрельба по мячам, стрельба из лука, ружья, размахивание бейсбольными битами, тренировка владения мечом, Бросать.

5) Человеческие действия: фехтование, объятия, удары ногой, поцелуи, удары кулаками, рукопожатие, бой на мечах.

 

статистика

Категория действия, Часть тела, Действие камеры, Точка обзора
ActionCategories 身体的一部分 CameraMotion CameraPosition1
Качество клипа, продолжительность клипа, количество продолжительностей клипа
ClipQuality 持续时间 Duration_count

Стабилизация видео

Основная проблема, связанная с использованием видеоклипов, извлеченных из реального видео, заключается в том, что может быть значительное движение камеры/фона, которое, как предполагается, мешает расчетам локального движения и должно быть исправлено. Чтобы убрать движение камеры, мы выравниваем кадры клипа, используя стандартные приемы сшивки изображений. Эти методы оценивают фоновые плоскости, обнаруживая и затем сопоставляя характерные черты в двух соседних кадрах. Соответствие двух кадров вычисляется с использованием мер расстояния, включая абсолютные разности пикселей и эйлеровы расстояния обнаруженных точек. Затем точки с наименьшим расстоянием сопоставляются, и алгоритм RANSAC используется для оценки геометрического преобразования между всеми соседними кадрами (независимо для каждой пары кадров). Используя эту оценку,

оригинальный ИМГС Стабильный IMGS
00001 00002
00020 00021
00050 00051

Другие тесты распознавания действий

Эта работа была начата в KTH:набор данных KTHСодержит шесть типов действий, каждая категория действий содержит 100 клипов. с последующимWeizmannсобранный институтомНабор данных Вейцмана, который содержит 10 категорий действий и 9 клипов в каждой категории. Вышеупомянутые две группы были записаны в контролируемой и упрощенной установке. Первые наборы данных о реальных действиях, собранные из фильмов и аннотированные из сценариев фильмов, были затем созданы в INRIA.голливудская человеческая деятельностьСодержит 8 типов экшенов, количество клипов на экшен-класс варьируется от 60 до 140 на экшен. его расширенная версияHollywood2 Human Actions SetВсего представлено 3669 видеороликов в десяти сценариях, распределенных по десяти категориям человеческого поведения. Должен Панель УКУТакже были собраны наборы данных о действиях, в основном с YouTube. UCF Sports включает 9 видов спорта и 182 клипа, UCF YouTube содержит 11 классов действий, а UCF50 содержит 50 классов действий. В статье мы покажем, что на видео с YouTube могут оказывать влияние характеристики низкого уровня, а это означает, что характеристики низкого уровня (например, цвет и суть) более различительны, чем страхи среднего уровня (например, движение и форма).

набор данных год #действие #CLIPS PER ACTION
KTH 2004 год 6 10
Вейцман 2005 г. 9 9
IXMAS 2006 год 11 33
Голливуд 2008 год 8 30-140
УКФ Спорт 2009 год 9 14-35
Hollywood2 2009 год 12 61-278
UCF YouTube 2009 год 11 100
MSR 2009 год 3 14-25
Олимпийский 2010 16 50
UCF50 2010 50 минута. 100
HMDB51 2011 51 минута. 101

О странице