Самый ранний систематический контакт с понятием "человеко-компьютерное взаимодействие" был, когда я учился в колледже. Был профессиональный курс "Обучение медиа и технологиям". В настоящее время у меня осталось мало знаний. Помню только, что очень интересовался в этом профессиональном курсе в то время. Человеко-компьютерное взаимодействие — способ взаимодействия людей и машин.
Форма взаимодействия человека с компьютером была усовершенствована в трех аспектах:
1. Человеко-компьютерное взаимодействие с помощью мыши и клавиатуры в качестве среды;
2. Взаимодействие человека с компьютером через сенсорный экран, стилус и т.д.;
3. Взаимодействие человека с компьютером на основе голоса, в будущем может появиться больше форм взаимодействия человека с компьютером.
В процессе этого развития самым большим изменением является трансформация взаимодействия от изображения к голосу. Звуки несут человеческие мысли и эмоции, а образы несут человеческие представления и интуицию. Видимое графическое взаимодействие легче привлекает внимание пользователя, а первое впечатление о человеке определяется внешним видом. Хотя носитель изображения несет больший объем информации, для взаимодействия с графическим интерфейсом требуется прикосновение пальца для запуска, а взаимодействие в дальней зоне за пределами свободного рабочего диапазона руки может иметь барьеры для графического интерфейса. Здесь голосовое взаимодействие более выгодно в пределах определенного диапазона. Это также одна из величайших прелестей голосового взаимодействия: освобождение рук! По сравнению с взаимодействием с изображением голосовое взаимодействие также имеет свои преимущества, но в голосовом взаимодействии все же есть некоторые проблемы.
Основными проблемами голосового взаимодействия в настоящее время являются:
1. Неестественное пробуждение с помощью голосового взаимодействия Текущее пробуждение с помощью голосового взаимодействия заключается в том, чтобы разбудить машину с помощью голосовых команд, что недостаточно естественно. В жизни взаимодействие между людьми будет отражать взаимодействие посредством голоса, жестов, движения тела, расстояния и движения губ. Чтобы решить эту проблему, вы можете добавить более вызывающие воспоминания способы вызова голосового взаимодействия, и несколько способов сосуществуют для вызова голосового взаимодействия. Если судить о вызванном режиме взаимодействия по нескольким измерениям, первое измерение может быть расстоянием, чтобы судить о том, является ли оно ближним или дальним полем; второе измерение — это жесты, движения тела; третье измерение — движение губ, звук.
2. У робота нет эмоций, а метод взаимодействия слишком жесткий.EQ робота состоит из двух частей, одна часть - эмоциональное распознавание, а другая часть - эмоциональный отклик. Для распознавания эмоций с помощью блокировки лица, анализа изображений и других методов, позволяющих понять эмоции пользователя, и активного триггера, с помощью метода анализа естественного языка, пометки и анализа эмоциональных слов для определения эмоций пользователя. Для эмоционального преодоления эмоции пользователя отражаются путем анализа ввода пользователя и нескольких раундов анализа диалога. В сочетании с предыдущим распознаванием эмоций, основанным на понимании семантики речи, можно определить, что представляет собой эмоция пользователя, когда здесь возникает семантика речи.
3. Поведение роботов при взаимодействии недостаточно активно, в основном это пассивные взаимодействия, а процесс диалога неравноправен; 85% пользователей ожидают активного общения. В настоящее время большая часть взаимодействия роботов с человеком и компьютером запускается пассивно, что недостаточно активен, чтобы позволить пользователям не чувствовать себя замеченными. В то же время этот процесс является и механизмом неравноправного диалога: только при срабатывании машины она будет взаимодействовать с пользователем, а не активно распознавать эмоции людей, так называемое «наблюдение». Такие неравные взаимодействия также являются серьезной проблемой в настоящее время.
В настоящее время взаимодействие человека с компьютером в основном используется в трех сценариях: чат, вопросы и ответы и диалог.
Чат: Робот пассивно вызывает вопрос и ответ: это выражается в виде одного вопроса и одного ответа В настоящее время все еще отсутствует глубокая контекстная система ответов на вопросы. Большинство из них представляют собой экспертные системы для представления опыта в определенной области.
Демонстрационная станция:github.crmeb.net/u/LXT