[Концепция глубокого обучения]·Анализ принципов технологии блокировки и распознавания голосовых отпечатков

искусственный интеллект Python

Принципиальный анализ технологии блокировки голосовых отпечатков и распознавания голосовых отпечатков

 

Как работает блокировка голосового отпечатка? В чем принцип технологии распознавания голоса? Замки с голосовым отпечатком также представляют собой новое поколение умных дверных замков. Использование технологии распознавания голоса для разблокировки также применяется в дверных замках. Блокировка по отпечатку пальца и блокировка по отпечатку пальца имеют одну и ту же цель.В отличие от блокировки по отпечатку пальца, которая основана на технологии распознавания отпечатка пальца, блокировка по отпечатку голоса является техническим распознаванием звука.В этой статье объясняются технические принципы распознавания блокировки по отпечатку пальца.

图片6.jpg

Что такое блокировка голосового отпечатка

Замок голосового отпечатка применяет распознавание голосового отпечатка к системе контроля доступа, реализуя миф о легендарном «Сезам, откройся». Блокировка голосового отпечатка основана на технологии распознавания голосового отпечатка и является особым приложением технологии распознавания голосового отпечатка. Говорят, что использование блокировки голосового ввода в Японии и других странах стало более распространенным, и они применяют блокировки голосового ввода в помещении для обеспечения базовой защиты конфиденциальности.

Биометрическое распознавание голоса, также известное как распознавание говорящего, широко известное как распознавание голосовых отпечатков, представляет собой биометрический метод, который автоматически идентифицирует личность говорящего на основе его произношения, физиологических и поведенческих характеристик. Безопасность, обеспечиваемая распознаванием голосового отпечатка, сравнима с другими биометрическими технологиями, такими как отпечаток пальца, ладонь и радужка, а устройство захвата голоса недорогое, требует только телефона/мобильного телефона или микрофона без специального оборудования; оно не имеет ничего общего с язык речи, тон диалекта, не затрагивает вопросов конфиденциальности и подходит для широкого круга людей, голосовые сигналы легко передавать и получать удаленно, в телекоммуникационных и сетевых приложениях идентификации распознавание голосовых отпечатков лучше и уникальный.

图片5.jpg

Подробное введение в принцип работы блокировки голосовой печати

Подобно отпечаткам пальцев и ДНК человека, голосовые отпечатки также являются уникальными биометрическими характеристиками человеческого тела, и трудно найти двух людей с точно такими же голосовыми отпечатками.

Распознавание голоса, тип биометрической технологии. Также известное как распознавание говорящего, существует две категории: распознавание говорящего и подтверждение говорящего. В разных задачах и приложениях будут использоваться разные технологии распознавания голоса: например, технология идентификации может потребоваться при сужении объема уголовных расследований, а технология подтверждения может потребоваться для банковских транзакций. Распознавание голосовых отпечатков заключается в преобразовании акустических сигналов в электрические сигналы с последующим использованием компьютера для идентификации.

Так называемый голосовой отпечаток (Voiceprint) — это спектр звуковых волн, несущий речевую информацию, отображаемую электроакустическими приборами. Производство человеческого языка представляет собой сложный физиологический и физический процесс между речевым центром человека и голосовыми органами.Голосовые органы, которые люди используют при разговоре,— язык, зубы, гортань, легкие и полость носа — очень различны по размеру и форме. . , поэтому голосовые отпечатки любых двух людей различны.

Акустические характеристики речи каждого человека обладают как относительной стабильностью, так и вариативностью, а не являются абсолютными и неизменными. Это изменение может быть связано с физиологией, патологией, психологией, симуляцией, маскировкой, а также связано с нарушениями окружающей среды. Однако, поскольку голосовые органы у всех разные, люди все равно могут различать голоса разных людей или судить, является ли это голосом одного и того же человека в нормальных обстоятельствах.

Распознавание голосовых отпечатков (VPR), также известное как распознавание говорящего, имеет две категории: идентификация говорящего и проверка говорящего. Первый используется для определения того, кто из нескольких человек произнес определенный голос, что представляет собой задачу «множественного выбора», в то время как второй используется для подтверждения того, что определенный голос говорит назначенное лицо, что представляет собой задачу «один к одному». -одно суждение". "проблема. В разных задачах и приложениях будут использоваться разные технологии распознавания голоса: например, технология идентификации может потребоваться при сужении объема уголовных расследований, а технология подтверждения может потребоваться для банковских транзакций. Будь то распознавание или подтверждение, сначала необходимо смоделировать голосовой отпечаток говорящего, что представляет собой так называемый процесс «обучения» или «обучения».

Основные задачи распознавания голосовых отпечатков включают в себя: обработку речевого сигнала, извлечение характеристик голосового отпечатка, моделирование голосового отпечатка, сравнение голосового отпечатка и принятие дискриминационных решений.

Можно сказать, что распознавание голосовых отпечатков имеет две ключевые проблемы: одна — извлечение признаков, а другая — сопоставление с образцом (распознавание образов).

Самая большая проблема, возникающая при применении блокировок голосовых отпечатков, заключается в том, что когда среда в приложении относительно шумная, это серьезно влияет на эффект распознавания. Таким образом, способность хорошо справляться с шумом окружающей среды стала важным критерием для проверки зрелости блокировки голосового отпечатка.

В последние годы несколько отечественных предприятий или научно-исследовательских институтов начали коммерческое продвижение в этой области.Поскольку некоторые технические узкие места не были преодолены, фактический эффект продвижения не оптимистичен.

Распознавание голосовых отпечатков по-прежнему является относительно передовой технологией в Китае, поэтому приложений, основанных на технологии распознавания голосовых отпечатков, еще меньше.

Суммировать

В настоящее время применение распознавания голоса в системах контроля доступа не является зрелым, но это также направление исследований интеллектуальных замков.