Что такое КРФ
CRF расшифровывается как Conditional Random Fields, которая является условной моделью распределения вероятностей другого набора выходных случайных величин при условии заданного набора входных случайных величин, Это модель неориентированного графа дискриминантной вероятности, Поскольку это дискриминант, то есть , моделирование условного распределения вероятностей.
CRF в основном используется в областях обработки естественного языка и обработки изображений.В NLP это вероятностная модель для маркировки и разделения данных последовательности.Согласно определению CRF, относительная последовательность - это заданная последовательность наблюдения X и выходная последовательность Y , а затем через Определить условную вероятность P(Y|X) для описания модели.
Предполагается, что выходная случайная величина CRF представляет собой модель неориентированного графа или марковское случайное поле, в то время как входная случайная величина не является марковским случайным полем в качестве условия. Структура графовой модели CRF теоретически может быть задана произвольно, но нашим общим является специальное условное случайное поле, определенное на линейной цепи, называемое линейным цепным условным случайным полем.
Вероятностная модель неориентированного графа
Как упоминалось ранее, выходная случайная величина CRF представляет собой вероятностную модель неориентированного графа, поэтому давайте теперь рассмотрим модель.
Модель вероятностного неориентированного графа представляет собой совместное распределение вероятностей, представленное неориентированным графом.Предполагая, что совместное распределение вероятностей P (Y) представлено неориентированным графом, узлы в графе представляют собой случайные величины, а ребра представляют зависимости между случайными Если совместное распределение вероятностей P(Y) удовлетворяет марковскому свойству, оно называется вероятностной моделью неориентированного графа или марковским случайным полем.
Как показано на рисунке ниже, граф представляет собой структуру, состоящую из узлов и ребер. Неориентированность означает, что ребра не имеют направления. Весь граф обозначается как G=(V, E), где V — множество узлов, а E это множество ребер.
Каждой вершине v соответствует случайная величина $Y_v$, поэтому
, при условии последовательности наблюдений X каждая случайная величина $Y_v$ удовлетворяет марковскому свойству, т.е.
Указывает, что w и v — две смежные вершины в графе G.
Линейное цепное условное случайное поле
Структура неориентированного графа теоретически может быть произвольной, но для задачи обработки меток в НЛП для его моделирования в основном используется наиболее простая и распространенная цепная структура, то есть линейное цепочное условное случайное поле. Как показано на рисунке ниже, можно видеть, что узел представляет собой линейную цепную структуру, узел соответствует элементам последовательности Y, а последовательность наблюдений X не делает никаких предположений о независимости, но структура последовательности X также может быть линейной цепной структурой.
Таким образом, последовательность случайных величин с линейной цепной структурой
, при заданной последовательности наблюдений X условное распределение вероятностей последовательности случайных величин Y равно $P(Y|X)$, если оно удовлетворяет марковскому свойству, т.е.
, то $P(Y|X)$ — линейное цепное условное случайное поле.
Определение вероятности
Как тренировать КРФ
Когда рассматривать CRF
Рассмотрите CRF, если информация связана с контекстом во времени или пространстве.
Ниже приведенырекламировать
========Время рекламы========
Моя новая книга «Анализ дизайна ядра Tomcat» продана на Jingdong, нуждающиеся друзья могут перейти кitem.JD.com/12185360.Контракт…Зарезервировать. Спасибо друзья.
Зачем писать «Анализ проектирования ядра Tomcat»
=========================
Добро пожаловать, чтобы следовать: