Источник контента:8 июля 2017 г. архитектор Tutu TuSDK Ли Ян провел «Облачное распознавание — как эффективно создать службу распознавания лиц в эпоху видения всех лиц» в разделе «Не только облачные вычисления, какие книги существуют в облачную эпоху»? «Обмен речью. IT Dajiashuo (id: itdakashuo), как эксклюзивный видео-партнер, имеет право публиковать видео после просмотра организатором и спикерами.
Количество слов для чтения:1116 | 4 минуты чтения
Резюме
Как использовать машинное обучение для эффективного создания сервиса распознавания лиц?
Искусственный интеллект и глубокое обучение
Еще несколько десятилетий назад в Соединенных Штатах родилась технология искусственного интеллекта, и машинное обучение является одним из методов достижения искусственного интеллекта. Машинное обучение также включает репрезентативное обучение и глубокое обучение.
Отношения между глубоким обучением и репрезентативным обучением подобны машинному обучению и системе правил. Самая ранняя из них — это система правил. Ее ввод и вывод — это правила, заранее установленные инженерами или учеными. Процесс расчета ввода представляет собой путь, заданный инженерами вручную.
Позже, когда появилась технология машинного обучения, извлекая признаки из определенного типа входного контента, можно было получить аналогичные результаты, поэтому не было необходимости формулировать огромную систему правил.
В будущем будет все меньше и меньше вещей, которые нужно будет настраивать вручную в середине, и глубокое обучение в основном стало сквозным процессом.
распознавание лица
Распознавание лиц: на входе — фотография, а на выходе — координаты одного или нескольких прямоугольников лица на фотографии.
Регистрация лица: положение черт лица и контуров лица на лице. Входными данными является прямоугольник лица, а выходными данными является положение ключевой точки контура лица. Если эти точки соединить в линию, то получится очертание человеческого лица.
Распознавание атрибутов: включая пол, возраст, выражение и другие эмоциональные атрибуты лица.
Извлечение признаков: это уникальный идентификационный код, используемый для идентификации лица.
Используя особенности каждого лица, можно выполнить сравнение лиц, проверку лица и распознавание лица. Под распознаванием лиц здесь конкретно понимается помещение фотографии лица в систему и сравнение ее по одной, чтобы определить ее личность. Следующий поиск лиц и кластеризация лиц основаны на характеристиках лица для сравнения.
Обнаружение живости используется для относительно высоких требований безопасности и должно выполнять работу, связанную с аутентификацией личности и аутентификацией.Другие вспомогательные методы проверки будут использоваться, чтобы убедиться, что распознанный объект является реальным человеком, а не фото или видео.
ЦП против графического процессора
Нам нужно декодировать форматы видео при просмотре ТВ или фильмов, что является одним из приложений GPU. Хотя вычислительная мощность каждого ядра графического процессора не так хороша, как у ЦП, он использует количество ядер, чтобы превзойти вычислительную мощность ЦП.
При использовании ЦП процесс выполнения программы является линейным, но ГП использует тысячи ядер для одновременного выполнения вычислений, чтобы реализовать свои преимущества в производительности.
Разработка и развертывание с использованием Docker
Появление Docker значительно повысило эффективность разработчиков, и он неотделим от разработки прототипа до непрерывной итерации производственной среды.
API описан с использованием Swagger, с использованием очень удобных для программистов JSON и YAML. После использования его для описания API вы можете напрямую создавать легко читаемые веб-документы, а также поддерживает онлайн-отладку, что очень удобно для пользователей.
Как показано на рисунке выше, это пример извлечения точек лица. Баллы будут использоваться, например, в стикерах для лица в системе прямых трансляций. Здесь будут затронуты некоторые технические детали, например, технология распознавания лиц, используемая в мобильном клиенте, на самом деле сильно отличается от серверной. Мобильный клиент ограничен размером своего устройства, а вычислительная мощность его графического процессора намного меньше, чем у высокопроизводительного устройства, используемого сервером, поэтому существует различие в выборе алгоритмов.
Мобильные телефоны обычно используют некоторые алгоритмы неглубокого обучения или алгоритмы глубокого обучения, разработанные или оптимизированные для мобильных телефонов. Хотя глубокое обучение имеет высокий уровень точности, оно требует более высокой производительности оборудования, чем традиционные алгоритмы, что является ключевым компромиссом между производительностью и эффектом машинного обучения.
Вот и все на сегодняшнем обмене, спасибо всем!