Обзор математики машинного обучения с примерами - 1. События и вероятности

машинное обучение математика

Различные концепции вероятности, полученные в результате эксперимента с игральными костями

1. Бросьте кости, вероятность выпадения 616\frac{1}{6}, бросать кости,Число известных вхождений четно, вероятность появления 6 равна13\frac{1}{3}, эта вероятностьУсловная возможность.

2.Условная возможностьДля: предположим, что мы знаем, что событие А произошло, и на этой основе мы хотим знать вероятность наступления события В. Эта вероятность является условной вероятностью, обозначаемой какP(BA)P(B|A)

3.Классическая вероятностная модель: Предположим, эксперимент сΩ\Omegaравновероятные исходы, событие A содержитXXрезультаты, событие B содержитYYрезультат,ZZПредставляет события, которые пересекаются:

image

Вероятность наступления события А:P(A)=XΩP(A) = \frac{X}{\Omega}; вероятность наступления события B:P(B)=YΩP(B) = \frac{Y}{\Omega}; вероятность того, что произойдут оба события А и В:P(AB)=ZΩP(AB) = \frac{Z}{\Omega}Если событие А уже произошло, то вероятность того, что событие В также произошло, равнаP(BA)=ZXP(B|A) = \frac{Z}{X}, разверните формулу: Эта формула является формулой условной вероятности

P(BA)=ZΩXΩ=P(AB)P(A)P(B|A) = \frac{\frac{Z}{\Omega}}{\frac{X}{\Omega}}= \frac{P(AB)}{P(A)}

4. Если условная вероятностьP(BA)P(B|A)больше, чемP(B)P(B), что означает, что наступление события A будет способствовать наступлению события B, как в приведенном выше примере с броском игральной кости. Вы также можете увидеть картинку ниже, самуP(B)P(B)Вероятность события B относительно мала.В случае, если событие A произошло, вероятность наступления события B также увеличивается из-за большого количества пересекающихся частей:

image

5. Если условная вероятностьP(BA)P(B|A)меньше, чемP(B)P(B), что означает, что событие A не будет способствовать наступлению события B. Например, событие A означает, что количество бросков костей четное, а событие B означает, что количество бросков костей меньше 4. Вероятность обоих событий А и событие В происходят1/21/2, вероятность того, что события А и В произойдут одновременно, равна1/61/6,Условная возможностьP(BA)P(B|A)за1/31/3. Вы также можете увидеть картинку ниже, самуP(B)P(B)Вероятность относительно велика.В случае, если произошло событие А, вероятность наступления события В уменьшается из-за меньшего количества пересечений:

image

6. Если условная вероятностьP(BA)P(B|A)Он равен 0, а это означает, что событие А и событие В совершенно не пересекаются, то есть если событие А происходит, то событие В не должно произойти, а событие А и событие В не пересекаются.Несовместимые события,иливзаимоисключающие события. Как показано ниже:

image

7. Возможны также условные вероятностиP(BA)P(B|A)равныйP(B)P(B), в этом случае появление событий А и В на самом деле не связано друг с другом.Например, есть две кости.Событие А — это игра на кости 1, на которой выпало число 6, а событие В — это игра на кости 2, на которой выпало число 6. число 2. Произойдут событие A и событие B. Вероятность равна1/61/6, то вероятность того, что события А и В произойдут одновременно, равна136\frac{1}{36},Условная возможностьP(BA)P(B|A)равный16\frac{1}{6}, мы обычно называем это независимым событием. Как показано ниже:

image

Формула полной вероятности и экспериментальная проверка игры в кости

Предположим, естьA1,A2,...,AnA_1,A_2,...,A_nЭти взаимоисключающие события охватывают все возможные исходы эксперимента:

image

этоP(A1)+P(A2)+...+P(An)=1P(A_1) + P(A_2) + ... + P(A_n) = 1. Возьмем, к примеру, игральные кости, на самом деле они подбрасываются один раз, и выпадает 1, 2, 3, 4, 5, 6 очков.

Предположим, что есть другое событие B, представленное классической вероятностью, как показано на рисунке:

image

Вероятность события В, которую можно определить по событию В вA1,A2,...,AnA_1,A_2,...,A_nРассчитываются условные вероятности на эти взаимоисключающие события и вероятности этих событий, формула полной вероятности:

состояние:P(A1)+P(A2)+...+P(An)=1Условие: P(A_1) + P(A_2) + ... + P(A_n) = 1
результат:P(B)=P(BΩ)=P(BA1)+P(BA2)+...+P(BAn)=P(A1)P(BA1)+P(A2)P(BA2)+...+P(An)P(BAn)Результат: P(B) = P(B\Omega) = P(BA_1) + P(BA_2) + ... + P(BA_n) = P(A_1)P(B|A_1) + P(A_2)P( B|A_2) + ... + P(A_n)P(B|A_n)

Например, событие Б — бросок четного числа игральных костей.P(B)=12P(B) = \frac{1}{2},P(Aточки=1)P(BAточки=1)+P(Aточки=2)P(BAточки=2)+P(Aточки=3)P(BAточки=3)+P(Aточки=4)P(BAточки=4)+P(Aточки=5)P(BAточки=5)+P(Aточки=6)P(BAточки=6)=16*0+16*1+16*0+16*1+16*0+16*1=12P(A_{Points=1})P(B|A_{Points=1}) + P(A_{Points=2})P(B|A_{Points=2}) + P(A_{Points=3} )P(B|A_{Очки=3}) + P(A_{Очки=4})P(B|A_{Очки=4}) + P(A_{Очки=5})P(B|A_{Очки =5}) + P(A_{points=6})P(B|A_{points=6}) = \frac{1}{6} * 0 + \frac{1}{6} * 1 + \frac {1}{6} * 0 + \frac{1}{6} * 1 + \frac{1}{6} * 0 + \frac{1}{6} * 1 = \frac{1}{2}

Использование формулы полной вероятности: футбольный прогноз

Смысл формулы полной вероятности состоит в том, что в большинстве случаев мыТрудно напрямую вывести вероятность события B, как в эксперименте с игрой в кости.Да, нам нужно ограничить выборочное пространство событий и абстрагировать события от существующих выборок.A1,A2,...,AnA_1,A_2,...,A_n, а заодно посчитаем вероятности появления B на этих событиях, и в итоге получим вероятность события B.

Например, чтобы предположить вероятность того, что британская команда выиграет у немецкой команды в этом Кубке европейских чемпионов, мы можем оценить голы британской команды с помощью исторических игровых данных (таких как данные последних игр Кубка европейских чемпионов и данные две команды друг против друга) Вероятность того, что числа равны 0, 1, 2, 3, 4, 5..., вероятность того, что немецкая команда забьет 0, 1, 2, 3, 4, 5..., гдеГолы Англии больше, чем вероятность победы Германии. Это приложение формулы полной вероятности.

от причины к следствию и от следствия к причине

Формула полной вероятности:Вывод от причины к следствию, типичным примером является упомянутое выше предположение о вероятности победы британской команды над немецкой командой в этом еврокубке. Основываясь на данных прошлых игр, мы можем рассчитать среднее количество голов, забитых британской командой и немецкой командой Вероятность забитого гола в целом соответствуетраспределение Пуассона(Мы упомянем об этом позже и будем использовать этот пример для подробного анализа), согласнораспределение Пуассона, мы можем получить вероятность того, что британская команда и немецкая команда забьют n, полагая, что средний результат британской команды равен 1,67, а средний результат немецкой команды равен 1,52 (мы рассматриваем только ситуацию, когда количество голов это 4):

команда 0 голов 1 гол 2 гола 3 гола 4 гола
Великобритания 0.1882 0.3144 0.2625 0.1461 0.061
Германия 0.2187 0.3324 0.2527 0.128 0.0486

ПредположениеP(A0)P(A_0)Вероятность забить 0 голов за Англию и так далее:

P(A0)=0.1882P(A_0) = 0.1882
P(A1)=0.3144P(A_1) = 0.3144
P(A2)=0.2625P(A_2) = 0.2625
P(A3)=0.1461P(A_3) = 0.1461
P(A4)=0.061P(A_4) = 0.061

ПредположениеP(B)P(B)есть вероятность победы британской команды по формуле полной вероятности:

P(B)=P(A0)P(BA0)+P(A1)P(BA1)+P(A2)P(BA2)+P(A3)P(BA3)+P(A4)P(BA4)P(B) = P(A_0)P(B|A_0) + P(A_1)P(B|A_1) + P(A_2)P(B|A_2) + P(A_3)P(B|A_3) + P(A_4)P(B|A_4)
P(BA0)=0P(B|A_0) = 0
P(BA1)=Цель Германии -0Вероятность=0.2187P(B|A_1) = вероятность того, что Германия забьет 0 = 0,2187.
P(BA2)=Цель Германии -0,1Вероятность=0.2187+0.3324=0.5511P(B|A_2) = Вероятность того, что Германия забьет 0, 1 = 0,2187 + 0,3324 = 0,5511
P(BA3)=Цель Германии -0,1,2Вероятность=0.2187+0.3324+0.2527=0.8038P(B|A_3) = вероятность того, что Германия наберет 0, 1, 2 = 0,2187 + 0,3324 + 0,2527 = 0,8038
P(BA4)=Цель Германии -0,1,2,3Вероятность=0.2187+0.3324+0.2527+0.128=0.9318P(B|A_4) = Вероятность того, что Германия забьет 0, 1, 2, 3 = 0,2187 + 0,3324 + 0,2527 + 0,128 = 0,9318
P(B)=0.1882*0+0.3144*0.2187+0.2625*0.5511+0.1461*0.8038+0.061*0.9318=0.3877P(B) = 0.1882 * 0 + 0.3144 * 0.2187 + 0.2625 * 0.5511 + 0.1461 * 0.8038 + 0.061 * 0.9318 = 0.3877

Однако в реальных проблемах мы часто сталкиваемся с проблемой установления причины, например, когда мы проводим физикальное обследование и обнаруживаем полип желчного пузыря, вызван ли он опухолью, холестерином или другими причинами? Это требует, чтобы мы предположили причину образования этого результата. Это ведет кбайесовская формула

Понимание априорных и апостериорных вероятностей на примере футбольного прогноза

Прежде чем упомянуть формулу Байеса, давайте проясним два понятия,Априорная вероятностьиАпостериорная вероятность.

Априорная вероятностьОбычно она получается опытным путем, то есть на основе исторически собранных данных без каких-либо ограничений получается эмпирическая вероятность. Вероятность количества голов, забитых двумя командами, полученная из исторических данных игры, упомянутых в приведенном выше примере, равнаАприорная вероятность. В это время предположим, что игра начинается, а затем происходит событие.Защитник немецкой команды ошибся, а Кейн забил гол британской команды.В это время нам нужно пересчитать вероятность количества голов, забитых двумя команды в соответствии с этой предпосылкой. ЭтоАпостериорная вероятность.

Априорная вероятностьТо есть эмпирическая вероятность, которая полностью выводится из исторических данных без вероятности какой-либо предпосылки, которая имела место.Апостериорная вероятностьто есть наблюдение явления требуетАприорная вероятностьВероятность исправления. Можно просто понять, что до начала игры предполагаемая вероятность, как правило, является априорной вероятностью.После начала игры, после появления красных и желтых карточек, пенальти, голов, замен и т. д. вероятность корректируется после вероятность получена тестовая вероятность.

Формула Байеса и причина образования полипов желчного пузыря

Предположим, что есть события А и В, тогда:

P(AB)=P(AB)P(B)=P(BA)P(A)P(B)P(A|B) = \frac{P(AB)}{P(B)} = \frac{P(B|A)P(A)}{P(B)}

Это формула Байеса, мы объединяем формулу полной вероятности, предполагая, что наше событиеA1,A2,...,AnA_1, A_2, ..., A_nЭти взаимоисключающие события составляют полный набор выборочного пространства, а именно:

P(A1B)=P(BA1)P(A1)P(B)=P(BA1)P(A1)P(BA1)P(A1)+P(BA2)P(A2)+...+P(BAn)P(An)P(A_1|B) = \frac{P(B|A_1)P(A_1)}{P(B)} = \frac{P(B|A_1)P(A_1)}{P(B|A_1)P(A_1) + P(B|A_2)P(A_2) + ... + P(B|A_n)P(A_n)}

Возьмем в качестве примера причину образования полипов желчного пузыря.Пусть посчитаем, что в выборке из миллиона пациентов в определенной больнице у 8% есть опухоли, а у 20% из них обнаружены полипы желчного пузыря, а у лиц с симптомами высокий уровень холестерина у 80% людей, из которых у 40% обнаружены полипы желчного пузыря, а у 30% из оставшихся 12% обнаружены полипы желчного пузыря. ПредположениеA1A_1за опухоль,A2A_2для холестерина,A3A_3для других.BBПри полипах желчного пузыря. Тогда вероятность того, что полип желчного пузыря является опухолью, равна:

P(A1B)=P(BA1)P(A1)P(BA1)P(A1)+P(BA2)P(A2)+P(BA3)P(A3)=0.2*0.080.2*0.08+0.4*0.8+0.3*0.12=0.043P(A_1|B) = \frac{P(B|A_1)P(A_1)}{P(B|A_1)P(A_1) + P(B|A_2)P(A_2) + P(B|A_3)P(A_3)} = \frac{0.2 * 0.08}{0.2 * 0.08 + 0.4 * 0.8 + 0.3 * 0.12} = 0.043