Опыт тестирования алгоритма фабрики ИИ: каковы ключевые показатели распознавания лиц?

Всего несколько лет назад программисты должны были уметь писать алгоритмы для разработки приложения для распознавания лиц. Но теперь, с открытием зрелых алгоритмов, все больше и больше разработчиков должны сосредоточиться только на разработке продуктов для вертикальных отраслей.

В «Исследовании карты индустрии искусственного интеллекта Китая», опубликованном исследовательским агентством, также есть ряд интересных данных. 40,7%. Посещаемость по распознаванию лиц, проверка личности в финансовых приложениях, распознавание лиц в больницах и государственных учреждениях, проверка лиц на станциях...

В настоящее время на рынке есть библиотеки алгоритмов с открытым исходным кодом, такие как OpenCV, и многие производители микросхем имеют свои собственные простые алгоритмы в своих продуктах.В то же время профессиональные производители алгоритмов также откроют связанные технологии, такие как Arcsoft Vision Open. Платформа, предоставляющая бесплатные и автономные SDK для распознавания лиц. Для разработчиков, перед лицом нескольких алгоритмов, очень важно, как лучше понять производительность алгоритма. Поэтому в этой статье один за другим будут представлены принципы алгоритма, сценарии применения и ключевые индикаторы.

Краткое введение в принцип работы алгоритма распознавания лиц

Прежде чем представить ключевые показатели эффективности, нам необходимо уточнить технические принципы распознавания лиц.

Так называемое распознавание лиц (Face Recognition) заключается в обнаружении, идентификации и отслеживании лица на изображении. Текущее распознавание лиц обычно использует сверточную нейронную сеть (CNN) для обучения на большом количестве изображений лиц, а затем извлекает соответствующие значения характеристик лица из входного изображения.

Значение черты лица представляет собой информационный набор, состоящий из черт лица. Человеческая память и идентификация лица в основном опираются на черты, видимые невооруженным глазом, такие как лицо национального характера, двойные веки, черные глаза, голубые волосы, сложенная переносица... Но искусственный интеллект отличается, в основном с помощью сверточная нейронная сеть (CNN) Обучение на массивных изображениях лиц. Они могут абстрагировать черты лица, которые людям трудно понять, и, таким образом, превосходят людей в способности распознавания.

Собственные значения лица представляют собой набор пространственных векторов и основу для сравнения лиц. Собственные значения, извлеченные из разных фотографий одного и того же лица, очень близки в пространстве признаков, а лица разных людей находятся далеко друг от друга в пространстве признаков. Другими словами, близкие люди с большей вероятностью будут одним и тем же человеком.

Также обратите внимание, что распознавание лиц и обнаружение лиц — это не одна и та же технология. Обнаружение лиц является звеном в полном процессе распознавания лиц. После захвата изображения или видеопотока, содержащего лицо, с помощью камеры необходимо использовать технологию обнаружения лица для автоматического обнаружения и извлечения лица, а затем ввести предварительную обработку изображения лица и ссылку для извлечения наиболее основных черт лица.

В реальной коммерческой реализации распознавание лиц также может использоваться независимо от распознавания лиц.В типичных приложениях, таких как машины для измерения температуры с искусственным интеллектом, которые недавно стали популярными в стране и за рубежом, модуль измерения температуры активируется только при обнаружении лица, тем самым уменьшая долгосрочная стоимость продукта.Потери и потребление энергии операции, процесс не нужно распознавать лицо.

[Понимая эти показатели, вы также можете оценить алгоритм]

В идеальном состоянии чем выше точность распознавания лиц, тем лучше, но алгоритм будет зависеть от многих практических факторов, таких как подсветка, темный свет, сильный свет и угол распознавания, когда он будет коммерциализирован. Поэтому нецелесообразно рассматривать точность распознавания алгоритма отдельно от сценария использования.

Итак, как мы можем разумно и эффективно судить об алгоритме? Ключевые показатели тестирования алгоритмов подробно представлены в серии открытых технических курсов «Изучение распознавания лиц с нуля», запущенных Arcsoft Vision Open Platform, известной в отрасли бесплатной платформой алгоритмов. Заинтересованные разработчики могут щелкнуть ссылку ниже, чтобы узнать больше об этом.

«Изучите распознавание лиц с нуля: введение в алгоритмы распознавания лиц»love.arcsoft.com.capable/course/vide…

Ключевые показатели распознавания лиц:

В большинстве случаев мы используем FAR (коэффициент ложного принятия, также известный как коэффициент ложного распознавания, то есть вероятность ошибочной идентификации кого-то за кого-то другого) и FRR (коэффициент ложного отказа, то есть я зарегистрирован в базовой библиотеке, но сравнение Кривая сходства DET достигает непредсказуемого значения) в качестве эталона для оценки.

(1) Коэффициент ложного отказа (FAR)

Диапазон значений сходства делится на несколько степеней, и получаются несколько разных порогов S. FRR различных порогов S рассчитывается следующим образом: FRR(S) = количество сравнений с одним и тем же человеком ниже порога S / общее количество сравнений с одним и тем же человеком × 100%;

(2) Частота ложных срабатываний (FRR)

Величина сходства разбивается на несколько градаций и получается несколько разных порогов S. FAR разных порогов S рассчитывается следующим образом: FAR(S) = количество неидентичных сравнений подобия не ниже порога S / не- одинаковое отношение К к общему количеству × 100%;

В идеале и FAR, и FRR должны быть настолько низкими, насколько это возможно, но эти два показателя колеблются, и уменьшение одного обычно означает увеличение другого, поэтому необходимо найти баланс. Принято считать, что когда FAR достигает нормального рыночного уровня, чем ниже FRR, тем лучше работает алгоритм распознавания лиц.

В настоящее время большинство сценариев на рынке будут формулировать разные стандарты в соответствии с их собственными требованиями безопасности. Например, в сценарии управления доступом требуется, чтобы FAR был меньше 1/100 000. В настоящее время, чем ниже FRR, тем лучше эффект алгоритма. Возьмем в качестве примера следующий рисунок: Алгоритм 1 работает лучше, чем Алгоритм 2.

Основные индикаторы распознавания лиц:

Для оценки алгоритма распознавания лиц также есть четыре показателя: скорость обнаружения, частота ложных срабатываний, FPS и IOU.

В общем, мы также надеемся, что чем выше уровень обнаружения, тем лучше, а чем ниже уровень ложных срабатываний, тем совершеннее, но между ними нужен оптимальный баланс, и мы можем использовать кривую ROC для решения этой проблемы.

(1) Истинный положительный результат: обнаруженное лицо действительно является человеческим лицом, но на самом деле это все еще человеческое лицо.

(2) Ложное срабатывание: обнаруженное лицо на самом деле является фоном.

(3) Ложноотрицательный: он определяется как фон, но на самом деле это лицо

(4) True Negatives: обнаруженный фон на самом деле является фоном

В дополнение к самой модели алгоритма мы также можем улучшить общий эффект распознавания лиц с точки зрения инженерии и приложения.

Угол применения: Модель качества R & D, чтобы оценить качество обнаруженного лица, если качество плохое, оно не будет распознано, например, FQ (алгоритм определения качества изображения лица) открытой платформы Arcsoft Vision.

Инженерная перспектива: Чтобы наложить ограничения сцены, такие как разблокировка по лицу, выход на улицу и регистрация на месте проведения, пользователь должен стоять лицом к камере при хорошем освещении, чтобы избежать получения изображений низкого качества.

сопутствующие товары вОткрытая платформа распознавания лиц Arcsoftпонимать