Всего несколько лет назад программисты должны были уметь писать алгоритмы для разработки приложения для распознавания лиц. Но теперь, с открытием зрелых алгоритмов, все больше и больше разработчиков должны сосредоточиться только на разработке продуктов для вертикальных отраслей.
В «Исследовании карты индустрии искусственного интеллекта Китая», опубликованном исследовательским агентством, также есть ряд интересных данных. 40,7%. Посещаемость по распознаванию лиц, проверка личности в финансовых приложениях, распознавание лиц в больницах и государственных учреждениях, проверка лиц на станциях...
В настоящее время на рынке есть библиотеки алгоритмов с открытым исходным кодом, такие как OpenCV, и многие производители микросхем имеют свои собственные простые алгоритмы в своих продуктах.В то же время профессиональные производители алгоритмов также откроют связанные технологии, такие как Arcsoft Vision Open. Платформа, предоставляющая бесплатные и автономные SDK для распознавания лиц. Для разработчиков, перед лицом нескольких алгоритмов, очень важно, как лучше понять производительность алгоритма. Поэтому в этой статье один за другим будут представлены принципы алгоритма, сценарии применения и ключевые индикаторы.
Краткое введение в принцип работы алгоритма распознавания лиц
Прежде чем представить ключевые показатели эффективности, нам необходимо уточнить технические принципы распознавания лиц.
Так называемое распознавание лиц (Face Recognition) заключается в обнаружении, идентификации и отслеживании лица на изображении. Текущее распознавание лиц обычно использует сверточную нейронную сеть (CNN) для обучения на большом количестве изображений лиц, а затем извлекает соответствующие значения характеристик лица из входного изображения.
Значение черты лица представляет собой информационный набор, состоящий из черт лица. Человеческая память и идентификация лица в основном опираются на черты, видимые невооруженным глазом, такие как лицо национального характера, двойные веки, черные глаза, голубые волосы, сложенная переносица... Но искусственный интеллект отличается, в основном с помощью сверточная нейронная сеть (CNN) Обучение на массивных изображениях лиц. Они могут абстрагировать черты лица, которые людям трудно понять, и, таким образом, превосходят людей в способности распознавания.
Собственные значения лица представляют собой набор пространственных векторов и основу для сравнения лиц. Собственные значения, извлеченные из разных фотографий одного и того же лица, очень близки в пространстве признаков, а лица разных людей находятся далеко друг от друга в пространстве признаков. Другими словами, близкие люди с большей вероятностью будут одним и тем же человеком.
Также обратите внимание, что распознавание лиц и обнаружение лиц — это не одна и та же технология. Обнаружение лиц является звеном в полном процессе распознавания лиц. После захвата изображения или видеопотока, содержащего лицо, с помощью камеры необходимо использовать технологию обнаружения лица для автоматического обнаружения и извлечения лица, а затем ввести предварительную обработку изображения лица и ссылку для извлечения наиболее основных черт лица.
В реальной коммерческой реализации распознавание лиц также может использоваться независимо от распознавания лиц.В типичных приложениях, таких как машины для измерения температуры с искусственным интеллектом, которые недавно стали популярными в стране и за рубежом, модуль измерения температуры активируется только при обнаружении лица, тем самым уменьшая долгосрочная стоимость продукта.Потери и потребление энергии операции, процесс не нужно распознавать лицо.
[Понимая эти показатели, вы также можете оценить алгоритм]
В идеальном состоянии чем выше точность распознавания лиц, тем лучше, но алгоритм будет зависеть от многих практических факторов, таких как подсветка, темный свет, сильный свет и угол распознавания, когда он будет коммерциализирован. Поэтому нецелесообразно рассматривать точность распознавания алгоритма отдельно от сценария использования.
Итак, как мы можем разумно и эффективно судить об алгоритме? Ключевые показатели тестирования алгоритмов подробно представлены в серии открытых технических курсов «Изучение распознавания лиц с нуля», запущенных Arcsoft Vision Open Platform, известной в отрасли бесплатной платформой алгоритмов. Заинтересованные разработчики могут щелкнуть ссылку ниже, чтобы узнать больше об этом.
«Изучите распознавание лиц с нуля: введение в алгоритмы распознавания лиц»love.arcsoft.com.capable/course/vide…
«Изучите распознавание лиц с нуля: введение в алгоритмы распознавания лиц»love.arcsoft.com.capable/course/vide…
Ключевые показатели распознавания лиц:
В большинстве случаев мы используем FAR (коэффициент ложного принятия, также известный как коэффициент ложного распознавания, то есть вероятность ошибочной идентификации кого-то за кого-то другого) и FRR (коэффициент ложного отказа, то есть я зарегистрирован в базовой библиотеке, но сравнение Кривая сходства DET достигает непредсказуемого значения) в качестве эталона для оценки.
(1) Коэффициент ложного отказа (FAR)
Диапазон значений сходства делится на несколько степеней, и получаются несколько разных порогов S. FRR различных порогов S рассчитывается следующим образом: FRR(S) = количество сравнений с одним и тем же человеком ниже порога S / общее количество сравнений с одним и тем же человеком × 100%;
(2) Частота ложных срабатываний (FRR)
Величина сходства разбивается на несколько градаций и получается несколько разных порогов S. FAR разных порогов S рассчитывается следующим образом: FAR(S) = количество неидентичных сравнений подобия не ниже порога S / не- одинаковое отношение К к общему количеству × 100%;
В идеале и FAR, и FRR должны быть настолько низкими, насколько это возможно, но эти два показателя колеблются, и уменьшение одного обычно означает увеличение другого, поэтому необходимо найти баланс. Принято считать, что когда FAR достигает нормального рыночного уровня, чем ниже FRR, тем лучше работает алгоритм распознавания лиц.
В настоящее время большинство сценариев на рынке будут формулировать разные стандарты в соответствии с их собственными требованиями безопасности. Например, в сценарии управления доступом требуется, чтобы FAR был меньше 1/100 000. В настоящее время, чем ниже FRR, тем лучше эффект алгоритма. Возьмем в качестве примера следующий рисунок: Алгоритм 1 работает лучше, чем Алгоритм 2.
Основные индикаторы распознавания лиц:
Для оценки алгоритма распознавания лиц также есть четыре показателя: скорость обнаружения, частота ложных срабатываний, FPS и IOU.
В общем, мы также надеемся, что чем выше уровень обнаружения, тем лучше, а чем ниже уровень ложных срабатываний, тем совершеннее, но между ними нужен оптимальный баланс, и мы можем использовать кривую ROC для решения этой проблемы.
(1) Истинный положительный результат: обнаруженное лицо действительно является человеческим лицом, но на самом деле это все еще человеческое лицо.
(2) Ложное срабатывание: обнаруженное лицо на самом деле является фоном.
(3) Ложноотрицательный: он определяется как фон, но на самом деле это лицо
(4) True Negatives: обнаруженный фон на самом деле является фоном
В дополнение к самой модели алгоритма мы также можем улучшить общий эффект распознавания лиц с точки зрения инженерии и приложения.
Угол применения: Модель качества R & D, чтобы оценить качество обнаруженного лица, если качество плохое, оно не будет распознано, например, FQ (алгоритм определения качества изображения лица) открытой платформы Arcsoft Vision.
Инженерная перспектива: Чтобы наложить ограничения сцены, такие как разблокировка по лицу, выход на улицу и регистрация на месте проведения, пользователь должен стоять лицом к камере при хорошем освещении, чтобы избежать получения изображений низкого качества.
сопутствующие товары вОткрытая платформа распознавания лиц Arcsoftпонимать