Это 16-й день моего участия в августовском испытании обновлений. Узнайте подробности события:Испытание августовского обновления
Скрытая марковская модель
Скрытая марковская модель также является генеративной моделью. Это вероятностная модель, используемая для описания перехода неявного состояния системы и вероятности выполнения неявного состояния.
концепция
Что такое рецессивное состояние?
Рецессивные цепи Маркова случайным образом генерируют последовательность состояний, в которой состояния являются рецессивными, то есть состояниями, которые не могут наблюдаться внешним миром. Мы называем это рецессивным состоянием. В дальнейшем статус.
Вероятность перехода между состояниями, заданнаяМатрица вероятности перехода состояния Выражать:
представляет состояние в момент времени tсуществуетпереход в состояниеВероятность.
Что такое наблюдение?
Рецессивное состояние, т. е. каждое состояние порождает соответствующеенаблюдение, который также производит последовательность наблюдений.
Матрица вероятности наблюденияиспользоватьВыражать:
представляет состояние в момент времени tгенерировать наблюденияВероятность.
Распределение вероятностей начального состояния, спредставляет вероятность каждого состояния в начальный момент.
Фактически HMM не может наблюдать последовательность перехода состояния системы, а может наблюдать только последовательность производительности состояния системы. Модель НММ может быть представлена тройкой, т.е..
Условия, которые должны быть выполнены HMM:
- Переход состояния должен удовлетворять марковскому свойству, то есть состояние гипотетической цепи Маркова в любой момент времени t связано только с предыдущим моментом времени и не имеет ничего общего с состояниями и наблюдениями в другие моменты времени.
- Предположение о независимости от наблюдений. То есть наблюдения независимы.
- Состояние должно иметь возможность приблизительно оценить.
Расчет вероятности
Учитывая модель HMMи текущийвременной ряд наблюдений, вычислить вероятность появления последовательности наблюдений.
прямой алгоритм
Форвардная вероятность: учитывая модель,Последовательность наблюдения за временем, а статус такойВероятность. На самом деле время отначать отталкивать
Вероятность наблюдения последовательности:
текущее состояниесуществуетфорвардная вероятность во времени.
обратный алгоритм
Обратная вероятность: Точно так же, фактически, это временной ряд отНачните продвигаться вперед. В частности, учитывая модель,отвремяПоследовательность наблюдения за временем, а статус такойВероятность.
Вероятность наблюдения последовательности:
Используя прямую и обратную вероятности, вероятность конечной последовательности наблюдений определяется следующим образом
данныйи последовательность наблюдения, состояние в момент времени tВероятность:
данныйи последовательность наблюдения, состояние в момент времени tИ он находится в состоянии в момент времени t+1Вероятность:
учиться
Есть два метода обучения. Одно обучение с учителем, а другое обучение без учителя.
Различие основано на типе обучающих данных. Если обучающие данные включают в себя последовательности наблюдений и соответствующие последовательности состояний, их можно реализовать с помощью обучения с учителем, то естьОценка максимального правдоподобия; Если обучающие данные представляют собой только последовательность наблюдений, она реализуется методом обучения без учителя, то естьЭМ-алгоритм.
Цель обучения очевидна, т. е. модельтри параметра в .
Оценка максимального правдоподобия
Известно, что в обучающей выборке есть последовательности наблюденийи соответствующая последовательность состояний,Сейчасобщийправильно.
Используя метод максимального правдоподобия, можно оценить параметры модели.
вероятность перехода состоянияЕго можно оценить следующим образом:
один из нихпредставляет образецсостояние моментаперейти ксостояние моментачастота возникновения. То есть сколько раз состояние появляется в выборкепереход в состояние в следующий момент. Это еще проще для понимания.
а наблюдаемая вероятностьоценивается как:
в,Указывает состояние в образцегенерировать наблюдениячастота.
Для вероятности начального состоянияОценка относительно проста и заключается в вычислении частоты появления каждого начального состояния во всех выборках.
На основе алгоритма EM
Оглядываясь назад на настройку, только в обучающих выборкахдлинаПоследовательность наблюдения за, наша цель также узнать параметры в модели.
из-за последовательности состоянийнеизвестно, HMM становится вероятностной моделью со скрытыми переменными:
Вопрос, как узнать параметры этой модели?
Ответ — алгоритм EM.
Мы знаем, что алгоритм EM делится на E шагов и M шагов.
Е шаг
E - спросить об ожиданиях. Сначала нам нужно инициализировать набор параметров. Затем определяется функция Q, которая является скрытой переменнойНайдите нужную функцию.
представляет оценочное значение. дальше,
Шаг E заключается в вычислении этой функции.
М шаг
М для максимизации. Три члена приведенного выше уравнения максимизируются соответственно.
Вот вывод с использованием метода множителей Лагранжа.Процесс немного сложный.Вы можете напрямую сослаться на содержание книги и не будем здесь распространяться.
Наконец, оценочные значения параметров могут быть решены:
Ссылаться на
- Учитель Ли Ханг - "Статистические методы обучения"