16-17 (1.2 Теория вероятностей)

искусственный интеллект

   Теперь предположим, что мы выбираем коробку наугад, и в результате получается синяя коробка. Тогда вероятность сорвать яблоко равна доле яблок в синем ящике, т.е.3/43/4,следовательноp(F=aB=b)=3/4p(F=a|B=b)=3/4. На самом деле, мы можем записать все четыре условные вероятности типов фруктов, учитывая выбранный ящик

p(F=aB=r)=1/4(1.16)p(F=a|B=r)=1/4\tag{1.16}
p(F=oB=r)=3/4(1.17)p(F=o|B=r)=3/4\tag{1.17}
p(F=aB=b)=3/4(1.18)p(F=a|B=b)=3/4\tag{1.18}
p(F=oB=b)=1/4(1.19)p(F=o|B=b)=1/4\tag{1.19}

Заметим еще раз, что эти вероятности нормированы, поэтому

p(F=aB=r)+p(F=oB=r)=1(1.20)p(F=a|B=r)+p(F=o|B=r)=1\tag{1.20}

такой же

p(F=aB=b)+p(F=oB=b)=1(1.21)p(F=a|B=b)+p(F=o|B=b)=1\tag{1.21}

   Теперь мы можем использовать правило суммы-произведения вероятностей, чтобы оценить общую вероятность сорвать яблоко.

p(F=a)=p(F=aB=r)p(B=r)+p(F=aB=b)p(B=b)=14×410+34×610=1120(1.22)p(F=a)=p(F=a|B=r)p(B=r)+p(F=a|B=b)p(B=b)=\frac{1}{4}\times\frac{4}{10}+\frac{3}{4}\times\frac{6}{10}=\frac{11}{20}\tag{1.22}

Таким образом, используя правило суммирования,p(F=o)=111/20=9/20p(F=o)=1-11/20=9/20.

   Вместо этого предположим, что нам сказали выбрать фрукт, это был апельсин, и мы хотели знать, из какой коробки он был. Это требует, чтобы мы оценили распределение вероятностей по ящику, обусловленное идентичностью фруктов, а вероятности в (1.16)(1.19) дают распределение вероятностей по фруктам, обусловленное идентичностью ящика. Используя теорему Байеса, мы можем решить обратную задачу условной вероятности

p(B=rF=o)=p(F=oB=r)p(B=r)p(F=o)=34×410×209=23(1.23)p(B=r|F=o)=\frac{p(F=o|B=r)p(B=r)}{p(F=o)}=\frac{3}{4}\times\frac{4}{10}\times\frac{20}{9}=\frac{2}{3}\tag{1.23}

Согласно правилу суммирования,p(B=bf=o)=12/3=1/3p(B=b|f=o)=1-2/3=1/3.

   Мы можем сделать следующую важную интерпретацию теоремы Байеса. Если бы нас спросили, какая коробка была выбрана, прежде чем нам сказали бы, какой фрукт выбран, наиболее полной информацией, которую мы могли бы получить, была бы вероятностьp(B)p(B). Мы называем это априорной вероятностью, потому что это вероятность, доступная до того, как мы наблюдаем свойства плода. Как только нам говорят, что фрукт — апельсин, мы можем использовать теорему Байеса для вычисления вероятностиp(BF)p(B|F), которую мы называем апостериорной вероятностью, поскольку онаFFвероятность, полученная впоследствии. Обратите внимание, что в этом примере априорная вероятность выбора красного ящика равна4/104/10, поэтому мы с большей вероятностью выберем синюю коробку, чем красную. Однако, как только мы заметим, что выбранный фрукт оранжевый, мы обнаружим, что апостериорная вероятность красного ящика теперь равна2/32/3, так что коробка, которую мы теперь с большей вероятностью выберем, на самом деле красная. Этот результат согласуется с нашей интуицией, поскольку доля апельсинов в красном ящике намного выше, чем в синем ящике, поэтому наблюдаемые апельсины во время созревания дают важные доказательства в поддержку красного ящика. На самом деле доказательства достаточно убедительны, чтобы превзойти предыдущие доказательства, чтобы сделать выбор красного прямоугольника более вероятным, чем синий.

   Наконец, заметим, что если совместное распределение двух переменных разложить на произведение полей, такое чтоp(X,Y)=p(x)p(Y)p(X,Y)=p(x)p(Y),ТакXXиYYназывается независимым. Из правила произведения мы видимp(YX)=p(Y)p(Y|X)=p(Y), так даноXXизYYУсловное распределение действительно такое же, какXXзначение не имеет значения. Например, в нашем примере с коробкой с фруктами, если каждая коробка содержит одинаковую пропорцию яблок и апельсинов, тоp(FB)=p(F)p(F|B)=p(F), поэтому вероятность выбора, скажем, яблока не зависит от того, какая коробка выбрана.