В статье «Глубокое приложение» рассматривается процесс разработки модели глубокого обучения распознавания лиц.

искусственный интеллект глубокое обучение

«Глубокое приложение» Обзор разработки модели распознавания лиц с глубоким обучением и процесса применения


0. Введение концепции

 

Метричное обучение, также известное как дистанционное метрическое обучение (DML), представляет собой тип машинного обучения. Суть его заключается в обучении по подобию, которое также можно рассматривать как дистанционное обучение. Потому что при определенных условиях сходство и расстояние могут переходить друг в друга. Например, два вектора в пространственных координатах могут использовать косинусное сходство или евклидово расстояние для измерения сходства.

Обычное распознавание лиц и голосовых отпечатков относится к метрическому обучению.

Общее метрическое обучение состоит из следующих шагов:

  1. Модель кодирования кодировщика: используется для кодирования необработанных данных в векторы признаков (Сосредоточьтесь на том, как обучать модель)
  2. Алгоритм распознавания сходства: сравнить пару векторов признаков на предмет сходства (Как рассчитать сходство и как установить порог)

 

1. Обучение модели кодирования

 

Обучение сетевой модели с использованием больших наборов данных. Модель кодирования может реализовать функцию извлечения векторов признаков из исходных данных.

В метрическом алгоритме обучения, основанном на глубоком обучении, его можно разделить на две школы:

  1. Школа сетевого дизайна: представление сиамской сети
  2. Школа улучшения убытков: представляет xx-softmax

В этой статье в основном рассказывается об общем процессе разработки, пожалуйста, обратитесь к конкретным деталям.

Путем обучения модели кодирования получается модель кодировщика с извлеченными признаками, так что исходные данные могут соответствовать вектору признаков через модель кодировщика:

X = Encoder(row)

Далее следует использовать эту модель кодировщика в качестве экстрактора признаков для оценки сходства.

 

2. Алгоритм распознавания подобия

 

После завершения первого шага (1. Обучение модели кодирования) получается модель кодирования с извлечением признаков, и эту сеть кодировщика можно использовать для разработки системы проверки.

Первым шагом является выполнение теста производительности модели кодирования, полученной на первом этапе. Действуйте следующим образом:

  1. Чтобы использовать тестовые данные для генерации тестовых пар, необходимо обеспечить максимально возможное количество случайных пар и сбалансированность положительных и отрицательных данных.Одна и та же метка равна 1, а разные метки равны 0.
  2. получить все векторы признаков, используя модель кодирования
  3. Вычислите сходство в соответствии с вектором признаков тестовой пары, необязательно степенью косинусного расстояния / евклидовым расстоянием
  4. В соответствии с подобием и меткой тестовой пары установите разумный пороговый диапазон, разрешение равно 0,0001, пройдите порог для расчета FAR (коэффициент ложного принятия) FRR (коэффициент ложного отклонения), два равны для получения EER (эквивалентная ошибка вероятность), порог в это время также является лучшим порогом. (Вы также можете использовать аналогичный метод для проверки точности)

С помощью вышеуказанных шагов можно получить производительность распознавания и порог применения модели.

Если вы хотите улучшить обобщающую способность порога, вы можете использовать метод проверки и проверки для расчета порога:

  1. Тестовые пары были разделены на группы по 10 человек, которые использовались для определения порогов и проверки интенсивного чтения.
  2. Используя одну из групп, количество однотипных ошибок суждения и количество разных типов ошибок суждения.
  3. Выберите порог с наименьшим количеством ошибок и используйте оставшиеся 9 групп для оценки точности распознавания.
  4. Шаги 2 и 3 выполняются 10 раз, а точность, полученная на каждом шаге 3, суммируется и усредняется для получения окончательной точности оценки. Запишите порог с наивысшей точностью и запишите его как оптимальный порог

 


Использованная литература:

1.blog.CSDN.net/с классическим китайским/AR…