1.2 Теория вероятностей
Ключевым понятием в области распознавания образов является неопределенность. Это возникает из-за шума в измерениях и ограниченного размера набора данных. Теория вероятностей обеспечивает последовательную основу для количественной оценки и обработки неопределенности и формирует одну из основных основ распознавания образов. В сочетании с решениями, обсуждаемыми в разделе 1.5 «Партизан», это позволяет нам делать наилучшие прогнозы с учетом всей доступной информации, даже если эта информация может быть неполной или неясной.
Познакомим с основными понятиями теории вероятностей на простом примере. Предположим, у нас есть две коробки, одна красная и одна синяя, в красной коробке 2 яблока и 6 апельсинов, а в синей коробке 3 яблока и апельсин. Это показано на рис. 1.9. Теперь предположим, что мы выбираем одну из коробок наугад, затем случайным образом выбираем фрукт из коробки, и, увидев, какой это фрукт, мы заменяем его коробкой, из которой он был взят. Мы можем представить себе повторение этого процесса несколько раз. Предположим, что при этом мы выбираем красную коробку в 40% случаев и синюю коробку в 60% случаев, и когда мы берем фрукт из коробки, мы с равной вероятностью выбираем любой фрукт из коробки. коробка.
Рисунок 1.9. Мы вводим основное понятие вероятности на простом примере, двух цветных коробках, каждая из которых содержит фрукты (яблоки показаны зеленым цветом, а апельсины — оранжевым).
В этом примере идентификатор ящика, который будет выбран, является случайной величиной, мы будем использоватьВыражать. Эта случайная величина может принимать одно из двух возможных значений, а именно(соответствует красной рамке) или(соответствует синей рамке). Точно так же идентичность фрукта также является случайной величиной, используяВыражать. он может использовать(яблоко) или(оранжевый) любое значение.
Во-первых, мы определяем вероятность события как долю числа событий, происходящих от общего числа испытаний, с учетом бесконечного предела общего числа испытаний. Следовательно, вероятность выбора красного цвета равна, вероятность выбора синего ящика равна. Запишем эти вероятности каки. Обратите внимание, что по определению вероятность должна находиться в интервалеВнутри. Кроме того, если события взаимоисключающие и если они включают все возможные исходы (например, в этом случае ящик должен быть красным или синим), то вероятность того, что мы увидим эти события, всегда должна быть равна 1.
Теперь мы можем задать такие вопросы, как: «Какова общая вероятность того, что программа выбора выберет яблоко?» или «Если мы выберем апельсин, какова вероятность того, что выбранная нами коробка будет синей?». Как только мы овладеем двумя основными правилами вероятности, правилом суммы и правилом произведения, мы сможем ответить на подобные вопросы и даже на более сложные вопросы, связанные с проблемами распознавания образов. Имея в руках эти правила, мы вернемся к нашему примеру с коробкой с фруктами.
Чтобы вывести правила для вероятности, рассмотрим две случайные величины, представленные на рис. 1.10.иБолее общий пример (например, переменные блока и фруктов, упомянутые выше). мы предполагаем, чтоможет принимать любое значение,в,может принимать значение,в. рассмотреть общееВ эксперименте у нас есть переменнаяиобразец и пустьизаколичество таких экспериментов. Аналогично, пустьценность(изначение не имеет значения) количество экспериментов сзначит, аналогично, пустьценностьколичество испытаний дляВыражать.
Рисунок 1.10 Мы можем рассмотреть две случайные величины с Запретным городомвывести правило суммы-произведения для вероятностей,ценность,в,ценность,вНа этой схеме имееми. Если мы рассмотрим общее количество экземпляров этих переменных, то выражаемипройти черезКоличество экземпляров , то есть количество точек в соответствующей ячейке массива. СписокКоличество точек в , соответствующих,Зависит отуказывает, а строкаКоличество точек в , соответствующих,Зависит отВыражать.
ценностьиценностьнаписанозначение, становитсяисовместная вероятность . это сделанобаллов как часть общего количества баллов, поэтому
Здесь мы неявно рассматриваем предел. похожи, независимо отВ чем ценность,ценностьВероятность записывается как, и поДана доля общего количества баллов в столбце, поэтому
Поскольку на рис. 1.10Количество экземпляров в столбце — это просто сумма количества экземпляров в каждой ячейке этого столбца, поэтому мы имеем, поэтому из (1.5) и (1.6) имеем
Это вероятностное правило сумм. Уведомление,иногда называется предельной вероятностью, потому что она вычисляется путем маргинализации или суммирования других переменных (в данном случае) в собственности.
Если рассматривать только, то оценка такого экземпляра равнанаписано как, и называетсяданныйусловная вероятность . найдя первыйстолбец принадлежит ячейкеСчет очков получается, поэтому
Учитывая (1.5), (1.6), (1.8), мы можем получить следующее соотношение
Это произведение вероятностного правила.
До сих пор мы очень тщательно проводили различие между случайными переменными, такими как коробка в примере с фруктами., и значения, которые может принимать случайная величина, например, если поле красное, то. следовательно,ценностьВероятность выражается как. Хотя это помогает избежать двусмысленности, но приводит к довольно громоздкой нотации, и во многих случаях такая педантичность не нужна. Вместо этого мы можем просто написатьдля представления случайных величинраспространение на , илидля представления определенного значенияРасчетное распределение при условии, что интерпретация в контексте ясна.
С помощью этих более компактных обозначений мы можем записать два основных правила теории вероятностей в следующей форме.
The Rules of Probability
правило суммирования (1.10)
Правило продукта (1.11)
здесьпредставляет собой совместную вероятность, используя "иПредставление «вероятность». Аналогично, количествопредставляет собой условную вероятность, выраженную как «данныеизвероятность», а количествоявляется предельной вероятностью, просто "Вероятность ". Эти два простых правила составляют основу всех вероятностных механизмов, которые мы используем в этой книге.
Согласно правилу произведения в сочетании с симметрией, сразу получаем условную вероятность
Связь между теоремой Байеса играет ключевую роль в идентификации закономерностей и машинном обучении. Использование запроса и формулы, знаменатель в теореме Байеса может использовать молекулы
представлено количеством, появляющимся в . Мы можем рассматривать знаменатель в теореме Байеса как нормирующую константу, чтобы убедиться, что условная вероятность в левой части (1.12) такая же, какСумма всех значений равна 1.
На рис. 1.11 мы показываем простой пример совместного распределения двух переменных, чтобы проиллюстрировать концепции предельного и условного распределений. Кроме того, извлеченные из совместного распределенияКонечная выборка точек данных, показанная в левом нижнем углу. два в правом верхнем углуГистограмма оценок точек данных с одним значением для каждой. По определению вероятности эти дроби равны пределуСоответствующая вероятность в. Мы можем думать о гистограмме как о простом способе моделирования распределения вероятностей, если из этого распределения берется конечное число точек. Моделирование распределений на основе данных лежит в основе распознавания статистических закономерностей, которое подробно рассматривается в этой книге. Остальные два рисунка на рис. 1.11 показываютиСоответствующие гистограммные оценки .
Рисунок 1.11 График распределения двух переменных,Возьмите девять возможных значений,Принимает два возможных значения. На верхней левой панели показана выборка из 60 точек, полученных из совместного распределения вероятностей этих переменных. Остальные графики показывают предельное распределениеиОценка гистограммы и условное распределение, соответствующее строке th на верхнем левом графике.
Теперь вернемся к нашему примеру с ящиками для фруктов. В настоящее время мы еще раз будем четко различать случайные величины и примеры. Мы видели, что вероятность выбора красного или синего ящика равна
данный. Обратите внимание, что они удовлетворяют.
Теперь предположим, что мы выбираем коробку наугад, и в результате получается синяя коробка. Тогда вероятность выбора яблока равна доле яблока в синем ящике, т.е.. следовательно. На самом деле, мы можем записать все четыре условные вероятности для типа фруктов, опять же учитывая выбранный ящик.
Обратите внимание, что эти вероятности нормированы, поэтому
и подобные
Теперь мы можем использовать правило суммы-произведения вероятностей, чтобы оценить общую вероятность того, что мы сорвем яблоко.
Согласно правилу суммирования,.
Вместо этого предположим, что наш ответчик, как известно, выбрал фрукт, то есть апельсин, и мы хотим знать, из какой коробки он был взят. Это требует, чтобы мы оценили распределение вероятностей по ящику, обусловленное идентичностью фруктов, а вероятности в (1.16)-(1.19) дают распределение вероятностей по фруктам, обусловленное идентичностью ящика. Мы можем решить проблему обращения условной вероятности, используя теорему Байеса, что дает
Согласно правилу суммирования,.
Мы можем сделать следующую важную интерпретацию теоремы Байеса. Если бы нас спросили, какая коробка была выбрана, прежде чем нам сказали бы, какой фрукт выбран, наиболее полной информацией, которую мы могли бы получить, была бы вероятность. Мы называем это априорной вероятностью, потому что это вероятность, доступная до того, как мы наблюдаем свойства плода. Как только нам говорят, что фрукт — апельсин, мы можем использовать теорему Байеса для вычисления вероятности, которую мы называем апостериорной вероятностью. Обратите внимание, что в этом примере априорная вероятность выбора красного ящика составляет 4/10, поэтому мы с большей вероятностью выберем синий ящик, чем красный. Однако, как только мы заметим, что выбранный фрукт оранжевый, мы обнаружим, что апостериорная вероятность красного ящика теперь равна 2/3, поэтому ящик, который мы теперь с большей вероятностью выберем, на самом деле красный. Этот результат согласуется с нашей интуицией, поскольку доля апельсинов в красном ящике намного выше, чем в синем ящике, поэтому наблюдаемый оранжевый фрукт является важным доказательством в поддержку ящика, да, вместо него был выбран красный ящик. синего ящика Скорее всего.
Наконец, заметим, что если совместное распределение двух переменных разложить на произведение полей, такое что,Такиназывается независимым. Из правила произведения мы видим, так даноизУсловное распределение действительно такое же, какзначение не имеет значения. Например, в нашем примере с фруктами и, если в каждой коробке содержится одинаковая доля яблок и апельсинов, то, поэтому вероятность выбора, скажем, яблока не зависит от того, какая коробка выбрана.