Мало знаний, большой вызов! Эта статья участвует в "Необходимые знания для программистов«Творческая деятельность.
Сегодня мы рассмотрим метод сравнения двух вероятностных распределений, называемый дивергенцией Кульбака-Лейблера (часто сокращенно дивергенцией КЛ). Сначала приведем формулу
Вышеприведенная формула, чтобы увидетьс цельюразница в вероятности. Он асимметричен и неотрицательен для KL-дивергенции.
В задаче о подбрасывании монеты мы предполагаем, что наблюдаемое нами число из N подбрасываний орла равно, а количество поднятий спинки равно. Предположим, что есть два распределения вероятностей P (настоящая монета) и Q, где распределение вероятностей P выражается какЭти две вероятности представляют вероятность того, что они выпадут один на один в распределении вероятностей P какВероятность оказаться задом наперед равна. И прогнозируемое распределение вероятностей равно Q(coin1), в котором вероятность выпадения лицевой стороной вверх в распределении равнаВероятность оказаться задом наперед равна
Используя предпосылку о распределении вероятностей P и распределении вероятностей Q соответственно, видим, что в N раз количество раз, когда решка выпадет вверх, равно, а количество поднятий спинки равноНаблюдения, также известные как вероятности.
Приведенное выше соотношение нормируется, т. е. принимаетсяВозьмите журнал после
Вот и весь процесс вывода.