С быстрым развитием искусственного интеллекта исследования и применение технологий компьютерного зрения постепенно вошли в зрелую стадию. Среди них распознавание лиц — технология, которая широко используется и проникла во все аспекты повседневной жизни человека. В настоящее время TSINGSEE Qingxi Video также активно разрабатывает проекты по распознаванию лиц, интегрируя технологию распознавания лиц в соответствующие видеоплатформы (такие как облачный сервис слияния видео EasyCVR) и внедряя ее в автономные сценарии.
В этой статье мы кратко поделимся с вами: как осуществляется распознавание лиц? Каков его процесс?
Во-первых, состав системы распознавания лиц
- Получение внешнего изображения
Передняя система сбора изображений лиц собирает изображения лиц, видеопотоки в реальном времени и т. д. с помощью снимков, таких как камеры видеонаблюдения, интеллектуальные машины посещаемости, интеллектуальные машины контроля доступа и другое оборудование, каждое из которых имеет функцию захвата лица. и снимок. - Внутренняя интеллектуальная платформа
Внутренняя интеллектуальная платформа может собирать, обрабатывать, хранить, применять, управлять и обмениваться соответствующими данными, собранными внешним интерфейсом, и объединяться с системой распознавания лиц для реализации функции распознавания лиц и применять ее в реальных сценариях, таких как как: посещаемость по распознаванию лиц, контроль доступа по лицу, отслеживание лица Министерства общественной безопасности, арест подозреваемых и т. д.
2. Каковы процессы технологии распознавания лиц?
1. Распознавание лиц
На практике обнаружение лиц в основном используется для предварительной обработки распознавания лиц, то есть для точной калибровки положения и размера лица на изображении.
Найдите положение лица по фотографии, возьмите левый верхний угол изображения за начало координат, запишите координаты левого верхнего и правого нижнего углов рамки лица соответственно и вырежьте часть лица.
2. Выравнивание лица
В реальных сценах лицо, захваченное фронтальным устройством, часто не обязательно является ракурсом фронтального лица, поэтому необходимо корректировать позу лица на изображении. Координаты ключевых точек лица получаются путем обнаружения ключевых точек лица, а угол лица регулируется в соответствии с координатами ключевых точек лица для выравнивания граней. Как показано на рисунке, эти два лица кажутся компьютеру совершенно разными лицами, поэтому нам нужно выровнять лица с помощью некоторых аффинных преобразований.
- 1) Аффинное преобразование
Функция аффинного преобразования представляет собой линейное преобразование из двумерных координат в двумерные координаты и поддерживает «прямолинейность» и «параллельность» двухмерной графики (относительное позиционное отношение между прямыми линиями остается неизменным, параллельные линии после аффинное преобразование, это по-прежнему параллельная прямая, и порядок расположения точек на прямой не изменится).
- 2) Метод выравнивания
Используйте обученную модель, чтобы автоматически отметить 68 ориентиров от обнаруженного лица, затем найдите стандартный шаблон в библиотеке шаблонов, используйте аффинную вариацию и сравните 68 точек с 68 точками выравнивания шаблона.
3. Кодирование лица (извлечение вектора признаков)
Модель обучается с помощью сверточной нейронной сети для автоматического кодирования входящего изображения лица модели в 128-мерный вектор с сильной семантикой.
Метод обучения:
- Введите фотографию известной личности.
- Введите фотографию той же личности.
- Введите фотографию другой личности.
- Несколько раз отрегулируйте параметры так, чтобы фотокоды на шагах 1 и 2 были как можно ближе и максимально отличались от кодов на шаге 3.
4. Классификация лиц
Вычислить евклидово расстояние 128-битной разности векторов между входным изображением и каждым изображением в базе данных по очереди, пока не будет найдено изображение, меньшее нашего порога.На этом этапе распознавание лица прошло успешно.
5. Экспериментальные результаты
На основе вышеописанных шагов проверим окончательный результат распознавания системы распознавания лиц.
3. Сценарии применения технологии распознавания лиц
Технология распознавания лиц в основном используется для проверки личности.Обычные сценарии включают в себя жилые районы, здания, кампусы, фабрики, парки, банки и т. д., например: интеллектуальный контроль доступа, лицевые ворота, присутствие лиц, интеллектуальные дверные замки и т. д. Проверка личности с помощью распознавания лиц обеспечивает безопасность соответствующих мест и снижает затраты на проверку вручную.
В мониторинге безопасности распознавание лиц также имеет большое значение, например, при обеспечении безопасности общественных мест (станций метро, вокзалов, улиц, гостиниц и т. д.) и преследовании подозреваемых Министерством общественной безопасности. На основе камер видеонаблюдения в общественных местах путем захвата лиц и загрузки результатов в сеть Министерства общественной безопасности они сравниваются с лицами подозреваемых, чтобы помочь сотрудникам общественной безопасности в их правоохранительной деятельности.
Технология распознавания лиц является ключевой технологией в области искусственного интеллекта и имеет очень широкий спектр перспектив применения в интеллектуальных системах видеонаблюдения. TSINGSEE Qingxi Video также сосредоточится на технологии интеллектуального обнаружения и идентификации ИИ, продолжит разработку интеллектуальных бизнес-систем и платформ в различных сценариях и углубит свои усилия в области ИИ.