Сколько существует методов распознавания лиц? В чем сложность исследования?

алгоритм
Сколько существует методов распознавания лиц? В чем сложность исследования?

Обнаружение лица - это сложное компьютерное зрение. В основном потому, что лицо - это динамический объект с высокой степенью изменчивости в его появлении. В последние годы технологии распознавания лиц достигли значительного прогресса. Однако высокоэффективное обнаружение лица остается сложной проблемой, особенно когда есть много мелких граней. Существует два метода обнаружения части лица: на основе функций методов и методы на основе изображений. 

1. Методы, основанные на признаках

Техника: методы, основанные на признаках, пытаются найти инвариантные признаки лиц для обнаружения. Основная идея основана на наблюдении, что человеческое зрение может легко распознавать лица в разных позах и условиях освещения, поэтому должны быть свойства или особенности, которые непротиворечивы, несмотря на эти различия. Был предложен широкий спектр методов для обнаружения черт лица, а затем для определения наличия лиц. 

Пример. Детекторы краев обычно извлекают такие черты лица, как глаза, нос, рот, брови, тон кожи и линию роста волос. На основе извлеченных признаков строится статистическая модель для описания взаимосвязи между ними и проверки наличия лиц на изображении. 

Плюсы: простота реализации, традиционный подход

Недостатки. Основная проблема алгоритмов, основанных на признаках, заключается в том, что признаки изображения могут быть сильно искажены освещением, шумом и окклюзией. Кроме того, границы признаков лиц будут ослаблены, а тени приведут к сильным краям, что сделает алгоритмы перцептивной группировки бесполезными. 

2. Методы на основе изображений

Техника: методы на основе изображений пытаются изучить шаблоны из примеров в изображениях. Таким образом, методы, основанные на внешнем виде, основаны на методах машинного обучения и статистического анализа, чтобы найти соответствующие особенности изображений «лицо» и «не лицо». Изученные признаки применяются к задаче обнаружения лиц в виде модели распределения или дискриминантной функции. 

Примеры: методы на основе изображений включают нейронные сети (CNN), машины опорных векторов (SVMi) или Adaboost. 

Преимущества: хорошая производительность, более высокая эффективность

Недостаток: сложно реализовать. Для эффективности вычислений и эффективности обнаружения часто требуется уменьшение размерности. Это означает, что размерность пространства признаков рассматривается путем получения набора доминирующих признаков, сохраняющих значимые свойства исходных данных.

метод распознавания лица

Были введены различные методы обнаружения лиц. 

1. Начальный этап. Распознавание лиц было сложной областью исследований с момента ее создания в 1990-х годах. 

До 2000 года, несмотря на множество исследований, реальная производительность распознавания лиц была далека от удовлетворительной, пока не появилась знаменательная работа Виолы и Джонса. Распознавание лиц прошло долгий путь со времен новаторской работы Виолы-Джонс (Viola and Jones 2004). Новаторское использование Виолой и Джонсом функций Хаара и AdaBoost для обучения детектора лиц с многообещающей точностью и эффективностью (Виола и Джонс, 2004) вдохновило на создание нескольких различных подходов. Однако у него есть несколько серьезных недостатков. Во-первых, его размер функции относительно велик. Кроме того, он не может эффективно обрабатывать не фронтальные лица и лица вне кадра.

2. Ранние этапы — машинное обучение: ранние подходы в основном были сосредоточены на извлечении различных типов созданных вручную признаков с помощью экспертов в области компьютерного зрения и обучении эффективных классификаторов для обнаружения с использованием традиционных алгоритмов машинного обучения.

Ограничения этих методов заключаются в том, что они обычно требуют, чтобы специалисты по компьютерному зрению создавали действительные функции, а каждый отдельный компонент оптимизировался индивидуально, что часто делало общий конвейер обнаружения неоптимальным.

Чтобы решить первую проблему, много усилий было направлено на то, чтобы предложить более сложные функции, такие как HOG (гистограмма ориентированных градиентов), SIFT (масштабно-инвариантное преобразование функций), sURF (ускоренные надежные функции) и ACF (агрегированные функции канала)). . Надежность обнаружения, комбинация нескольких детекторов, обученных отдельно для разных взглядов или поз, была разработана. Однако обучение и тестирование таких моделей обычно требует больше времени, а улучшение эффективности обнаружения относительно ограничено. 3

3. Современное состояние — глубокое обучение. В последние годы распознавание лиц с использованием методов глубокого обучения, особенно глубоких сверточных нейронных сетей (CNN), добилось значительного прогресса и добилось значительных успехов в различных задачах компьютерного зрения. 

По сравнению с традиционными методами компьютерного зрения, методы глубокого обучения избегают недостатков, созданных вручную, и доминируют во многих известных тестах производительности, таких как lmageNet Large-Scale Visual Recognition Challenge (ILSVRC).

Недавно исследователи применили Faster R-CNN, один из самых современных детекторов общих объектов, и получили многообещающие результаты. Кроме того, каскад CNN, региональная сеть предложений (RPN) и совместное обучение Faster R-CNN обеспечивают сквозную оптимизацию, а также контрольные показатели обнаружения лиц, такие как FDDB (база данных лиц) и т. д.

главная проблема

Трудность, с которой сталкивается распознавание лиц, является причиной снижения точности и скорости распознавания лиц. 

Этими проблемами являются сложный фон, слишком много лиц на изображении, странные выражения, освещение, низкое разрешение, окклюзия лица, цвет кожи, расстояние и ориентация и т. д. 

Необычное выражение лица: лица на изображениях могут иметь неожиданное или странное выражение лица. 

Освещение: Некоторые части изображения могут иметь очень сильное или очень слабое освещение или тени.

Тип кожи. Распознавание лиц для определения различных цветов лица является сложной задачей и требует более широкого разнообразия обучающих изображений.

Расстояние: если расстояние до камеры слишком большое, размер объекта (размер лица) может быть слишком маленьким. 

Ориентация: Ориентация лица и угол камеры влияют на скорость распознавания лиц.

Сложный фон: большое количество объектов в сцене может снизить точность и скорость обнаружения. 

Много лиц на одном изображении: изображение с большим количеством лиц очень сложно для точного обнаружения.

Окклюзия лица: лицо может быть частично закрыто такими объектами, как очки, шарфы, руки, волосы, головные уборы и т. д., что влияет на скорость обнаружения. 

Низкое разрешение: изображения с низким разрешением или шум изображения могут негативно повлиять на скорость обнаружения.

Сценарий применения распознавания лиц

Мониторинг толпы: обнаружение лиц используется для обнаружения скопления людей в общественных или часто посещаемых частных местах.

Взаимодействие человека с компьютером: несколько систем, основанных на взаимодействии человека с компьютером, используют распознавание лиц для обнаружения присутствия людей.

Фотография: некоторые современные цифровые камеры используют распознавание лиц для автофокусировки и многого другого.

Извлечение черт лица: черты лица, такие как нос, глаза, рот, цвет кожи и т. д., могут быть извлечены из изображений. .

Гендерная классификация: определение гендерной информации с помощью методов распознавания лиц. 

Распознавание лиц: идентификация и аутентификация человека по цифровым изображениям или видеокадрам.

Маркетинг: Распознавание лиц становится все более важным для маркетинга, анализа поведения клиентов или таргетинга рекламы. 

Посещаемость: распознавание лиц используется для обнаружения присутствия человека, оно часто сочетается с биометрическим обнаружением для управления доступом, например, для интеллектуального контроля доступа.

Наборы данных для распознавания лиц

Аннотированный набор данных Faces

(AFW) Аннотированные лица. Набор данных AFW был создан с использованием Flickrimages. Он включает 205 изображений и 473 помеченных лица. Для каждого лица аннотация изображения включает прямоугольную ограничивающую рамку, 6 ориентиров и углы позы. 

Набор данных лиц PASCAL (PASCAL FACE)

Этот набор данных используется для распознавания лиц и распознавания лиц; он является подмножеством PASCAL VoC и содержит 1335 помеченных лиц на 851 изображении с большими вариациями внешнего вида и позы. 

MIT Face Dataset (CBCL Face Database)

База данных распознавания лиц MIT-CBCL состоит из обучающего набора (2 429 лиц, 4 548 не-лиц) и тестового набора (472 лица, 23 573 не-лица). 

Набор данных и эталон для обнаружения лиц (FDDB)

Набор данных содержит 5171 лицо, аннотированное на 2845 изображениях, с широким спектром сложностей, таких как окклюзия, сложные позы и низкое разрешение изображения. Эти изображения используются для обучения большим вариациям внешнего вида, серьезным окклюзиям и серьезным ухудшениям размытия, которые распространены при обнаружении лиц в неограниченных сценариях реальной жизни. 

База данных CMU Multi-PIE (PIE)

База данных лиц CMU Multi-PIE содержит 41 368 изображений 68 человек, каждое из которых находится в 13 различных позах, 43 различных условиях освещения и с 4 различными выражениями. 

База данных лиц камеры наблюдения (sCface Dataset)

sCface — это база данных неподвижных изображений человеческих лиц. Изображения были сняты в неконтролируемом помещении с использованием пяти камер видеонаблюдения разного качества. Набор данных содержит 4160 неподвижных изображений (видимого и инфракрасного спектра) 130 объектов.

Набор данных WIDER FACE (Шире)

Набор эталонных данных для обнаружения лиц состоит из 32 203 изображений и 393 703 помеченных лиц с высокой вариабельностью масштаба, позы и окклюзии, что делает обнаружение лиц чрезвычайно сложным. Кроме того, набор данных WIDERFACE основан на 61 классе событий.

В последние месяцы мы обновили множество связанных процессов исследований и разработок, связанных с обнаружением и распознаванием лиц, таких как анализ пешеходов.Для основных платформ TSINGSEE Qingrhino Video в ближайшем будущем функции интеллектуального анализа будут постепенно интегрированы в сформировать новую платформу интеллектуального анализа, приглашаем всех обратить внимание на наши обновления.