Как разговорные системы искусственного интеллекта понимают язык

искусственный интеллект
Как разговорные системы искусственного интеллекта понимают язык

Мужчина влюбился в искусственный интеллект в фильме «Она»

Понимание речи — сложная задача для компьютерной программы. Буквальная интерпретация речи может отличаться от тона, выражения и подтекста или находиться под их влиянием.

Системы с голосовым управлением, такие как Alexa и Siri, отлично подходят для команд, но непрерывный разговор кажется более сложной, более _человеческой_ проблемой для решения. Системы разговорного диалога (SDS) понимают намерения пользователя, анализируя речь. Эти системы анализируют вовлеченные в речь семантические понятия — идеи, которые придают фразе или предложению общий смысл.

Система искусственного интеллекта разговорного диалога

Семантические понятия в человеческом диалоге могут иметь субсемантические, подрывные и многотерминальные понятия. Люди ироничны, референциальны и часто разделяют общее понимание контекста и подтекста. Это сложные проблемы, которые машины должны исследовать и делать выводы.

Неконтролируемое обучение, поддисциплина машинного обучения, представляет собой статистическую вычислительную концепцию, которая собирает информацию, тенденции и функции из необработанных, немаркированных данных. Например, использование программ обработки естественного языка (NLP) и методов кластеризации для обобщения корпуса конспектов лекций студентов для выявления доминирующих, максимальных общих понятий. Этот принцип используется для извлечения знаний из необработанных речевых данных.

Такие системы, как Siri, имеют компонент понимания разговорной речи (SLU), который связывает естественную речь с ее значением. SDS использует эту структуру смысла и речи, чтобы понять высказывание пользователя. Большинство систем ограничивают диалог несколькими предопределенными темами, хотя существует сильная инициатива по популяризации и расширению этих систем.

Понимание неразмеченной речи с использованием матричной факторизации

Система, предложенная Ченом, направлена ​​на понимание намерений с использованием моделей приобретения знаний и матричной факторизации. Эти модели могут идентифицировать как доминантные, так и рецессивные признаки. Например, в запросе «Хочу в дешевый ресторан» доминирующими признаками являются «дешево» и «ресторан». Индукция семантического понятия связывает слова с лежащими в их основе понятиями или слотами. Итак, «дешево» — это мера «дорого», а «ресторан» — это «целевое» место.

Концептуальные реляционные модели связывают лежащие в основе понятия и определяют вероятности семантического воздействия терминов, которые могут отсутствовать в пользовательских запросах. Хотя «еда» явно не упоминается в высказывании, модель узнает, что «еда» связана с «рестораном» с вероятностью 0,85, как вы можете видеть в правом нижнем углу изображения выше. Таким образом, система создает матрицу значений вероятности появления понятий в предложениях. Каждая строка представляет собой произносимое предложение или фразу, а каждый столбец — вероятность того, что понятие формирует значение этого предложения.

Диаграммы, фиксирующие отношения между семантическими понятиями

Используя предварительно обученную систему семантического анализа, система может автоматически извлекать взаимозависимые карты понятий из слова, как на картинке выше. Граф лексических знаний на основе слов, концептуально представленный на следующем рисунке, используется в сочетании для захвата онтологической структуры контента. Они генерируются, как только корпус воспринимается.

Построение графов знаний для объяснения дискурса

Вышеупомянутая матрица вероятностей состоит из матриц, представляющих два вышеупомянутых графа знаний, чтобы сформировать окончательную матрицу. Матричную факторизацию можно использовать для извлечения скрытых функций из этой матрицы. Этот метод линейной алгебры используется, потому что он помогает моделировать зашумленные данные, скрытую информацию и зависимости наблюдений.

Цель факторизации состоит в том, чтобы использовать существующие знания, зафиксированные в матрице, и ее факторы, чтобы сделать вывод о том, существует ли конкретная концепция в дискурсе. Это позволяет SDS понимать контекст и скрытые значения. Это также помогает устранить двусмысленность, поскольку система имеет онтологическое, реляционное и структурное понимание слова в предложении.

Помимо предсказания семантических понятий, система может понять, является ли запрос специфичным для предметной области. Добавление дополнительных знаний в предметной области позволяет уточнить детали. Включение дополнительных данных, таких как данные из Google Knowledge Graph, может помочь с обобщением и масштабируемостью.

эта статьяЭто эссерезюме. Я с нетерпением жду появления эмоционально интеллектуальных систем разговорного ИИ.


Как разговорные системы искусственного интеллекта понимают языкпервоначально опубликовано вNerd For Techжурнал, люди продолжают разговор, выделяя и отвечая на эту историю.