От распознавания лиц к повторной идентификации пешеходов — следующая тенденция

машинное обучение

распознавание лицаПосле того, как LFW превзошел способность распознавания человека, было сделано несколько крупных прорывов, и он постепенно превратился в распознавание лиц в видео или изучение атрибутов лица. Количество принятых статей на ведущих конференциях CV также демонстрирует устойчивую тенденцию.

иПовторное удостоверение личности пешехода(Повторная идентификация человека), также известная как повторная идентификация пешехода, представляет собой использованиекомпьютерное зрениеТехнология Технология, которая определяет, присутствует ли конкретный пешеход на изображении или видеоряде. широко рассматривается какпоиск изображенияподзадача. Получив изображение пешехода наблюдения, извлеките изображение пешехода на разных устройствах. Разработан для компенсации визуальных ограничений существующих в настоящее время фиксированных камер и может сочетаться собнаружение пешеходов/ технология слежения за пешеходами может найти широкое применение вИнтеллектуальное видеонаблюдение, интеллектуальная безопасность и другие области.

Повторное удостоверение личности пешеходаЭто одно из основных направлений исследований в Китае, и количество заявок увеличивается с каждым годом. Основными отечественными научно-исследовательскими учреждениями являются Университет Цинхуа, Пекинский университет, Фуданьский университет, Дагонг, Университет Сунь Ятсена, Китайский Гонконг, Китайская наука, Сиань Цзяотун, Китайская академия наук, Сямэньский университет и другие научно-исследовательские учреждения; за рубежом находятся Сидней. Технология, QMUL и UTSA и т. д. Количество принятых статей на ведущих конференциях CV по повторной идентификации личности неуклонно растет.


  1. Сначала давайте проанализируем с точки зрения приема на лучшие конференции
  • Количество документов по распознаванию лиц (поиск по ключевому слову «распознавание лиц», «проверка лиц»)

CVPR2013: 9

ICCV2013: 11

CVPR2014: 7

CVPR2015: 8

ICCV2015: 2

CVPR2016: 5

CVPR2017: 6

ICCV2017: 8

  • Количество документов, удостоверяющих личность (поиск по ключевому слову «повторная идентификация личности», «поиск личности», «поиск личности», «поиск пешехода»)

CVPR2013: 1

ICCV2013: 3

CVPR2014: 3

CVPR2015: 7

ICCV2015: 8

CVPR2016: 11

CVPR2017: 14

ICCV2017: 16

2. Сходства и различия между повторной идентификацией человека и распознаванием лиц

  • Повторная идентификация пешехода заключается в использовании фотографии под камерой для идентификацииразноеПоявлялся ли человек снова под камерой. Он должен иметь дело с изменением точки обзора камеры, изменением позы пешехода и т. д.
  • Распознаванию лиц дается пара, чтобы определить, является ли это одним и тем же человеком, или найти людей, которых вы видели в фотобиблиотеке.
  • Пешеходы имеют ту же структуру, что и человеческое лицо, но структура пешехода более сложная, с большим количеством частей, и ее нелегко выровнять.
  • Большие наборы данных о пешеходах получить сложно, в отличие от лиц, которые могут подобрать известных людей. Существующие наборы данных повторной идентификации пешеходов (DukeMTMC-reID, CUHK03, Market-1501 и т. д.) фактически записываются камерами в кампусе. Однако ранние небольшие наборы данных (Viper и т. д.) не могли обеспечить всестороннюю оценку и постепенно стали использоваться меньше.
  • Продуктов для реидентификации пешеходов очень мало, а приложений распознавания лиц уже реализовано большое количество? ?
  • Проблемы с несколькими камерами/межкамерными камерами, которые ранее изучались в академических кругах

Вышеизложенное является причиной того, что повторная идентификация пешеходов стала популярной в академическом мире.

3. Крупномасштабные наборы данных, обычно используемые для повторной идентификации личности.

  • DukeMTMC-reID

Набор данных находится вУниверситет ДьюкаСобственное приобретение, изображения поступают с 8 разных камер. Этот набор данных содержит обучающие и тестовые наборы. Обучающий набор содержит 16 522 изображения, а тестовый набор содержит 17 661 изображение. Всего в обучающих данных 702 человека, в среднем 23,5 обучающих данных на класс (на каждого человека). В настоящее время это самый большой набор данных для повторной идентификации пешеходов, который предоставляет аннотации атрибутов пешеходов (пол/длина рукавов/рюкзака и т. д.).

  • Market-1501

Набор данных находится вУниверситет ЦинхуаИзображения, снятые в кампусе, поступают с 6 разных камер, одна из которых имеет низкое разрешение. В то же время набор данных предоставляет обучающий набор и тестовый набор. Обучающий набор содержит 12 936 изображений, а тестовый — 19 732 изображения. Изображение автоматически определяется и обрезается детектором, содержит некоторые ошибки обнаружения (ближе к реальному использованию). Всего в тренировочных данных содержится 751 человек, а в тестовой выборке — 750 человек. Итак, в тренировочном наборе в среднем 17,2 тренировочных данных на класс (на каждого человека).

  • CUHK03

Набор данных находится вКитайский университет ГонконгаВнутреннее получение, изображения с 2-х разных камер. Этот набор данных обеспечивает как машинное, так и ручное обнаружение. Набор данных обнаружения содержит некоторые ошибки обнаружения, которые ближе к реальной ситуации. В среднем на каждого человека приходится 9,6 тренировочных данных.

4. Темы исследований, которые могут быть расширены в будущем

  • Трансферное обучение. Модель лица, изученная на LFW, может не работать на практике. Та же проблема существует и при повторной идентификации личности. Как исследовано в наборе данных Market-1501 (Летний Цинхуа Китайский), как применить его к другому набору данных DukeMTMC-reID (Герцог иностранцев зимой)
  • как человеческое лицо. Перейти к изучению атрибутов/повторной идентификации пешеходов на основе видео.
  • Сделайте более крупную и сложную библиотеку поиска, например Market-1501 + 500K (больше отвлекает потенциальных пешеходов).
  • Язык поисковых пешеходов. Находите людей по описаниям на естественном языке.

Визуализация кластеризации пешеходных объектов из [1]

[1] Zheng Z, Zheng L, Yang Y. A discriminatively learned cnn embedding for person re-identification arXiv preprint arXiv:1611.05666, 2016.

Другие статьи по теме:

Знать столбец:Повторное удостоверение личности пешехода