Экспоненциальные семейства распределений. Экспоненциальное семейное распределение включает ряд распределений, таких как распределение Гаусса, распределение Бернулли, биномиальное распределение, распределение Пуассона, бета-распределение и гамма-распределение.
Экспоненциальные семейные распределения относятся к наборам параметров вероятностных распределений следующего конкретного вида:
pX(x∣θ)=h(x)exp[η(θ)⋅T(x)−A(θ)]
в,T(x),h(x),η(θ),A(θ)— известная функция, то есть только параметрыθнеизвестный.θпараметры, называемые семьями.A(θ)Также называется функцией разделения журнала.
этоT(x), статистика является функцией выборки, и достаточно указать, что статистика содержит общие характеристики выборки. При такой достаточной статистике выборку можно игнорировать, что позволяет сэкономить место. Например, достаточной статистикой распределения Гаусса являются среднее значение и дисперсия, так что четкое распределение может быть получено путем вычисления среднего значения и дисперсии выборки.
сопряжение
Экспоненциальные семейные распределения часто сопряжены. Сопряженный априор делает априор и апостериор в одной и той же форме, что легко вычислить.
Что такое сопряжение?
Сначала рассмотрим формулу Байеса.
p(z∣x)=∫zp(x∣z)p(z)dzp(x∣z)p(z)
Заднийp(z∣x), так как интеграл от знаменателя найти труднее, то и напрямую найти апостериор сложнее. Сопряжение означает, что при определенной вероятностиp(x∣z)вниз, назадp(z∣x)и априориp(z)будет формировать такое же распределение. Тогда нет необходимости вычислять комплексный интеграл в качестве знаменателя.
Например, если вероятностьp(x∣z)является биномиальным распределением,p(z)является бета-распределением, то апостериорное распределение такжеp(z∣x)Также бета-распределение. которыйp(z∣x)∝p(x∣z)p(z).
Предполагая, что данные дискретны, для дискретной случайной величины x имеемnпризнаков, вероятность которыхpn, теперь требуется максимальная информационная энтропия, то максимальную энтропию можно выразить в виде задачи оптимизации с ограничениями:
max{H(p)}=min{n=1∑Npnlogpn}s.t.n=1∑Npn=1
Что касается этой знакомой задачи оптимизации с ограничениями, мы можем использовать метод множителей Лагранжа для ее решения,
Можно обнаружить, что в дискретных условияхpnЭнтропия максимальна, когда она подчиняется равномерному распределению. Это,В дискретных условиях максимальное распределение энтропии случайной величины при неинформативном априорном анализе является равномерным распределением.
Затем, когда у нас есть частичный набор данных, мы можем получить некоторые предварительные знания из набора данных, такие как эмпирическое распределение.p^(x)=Ncount(x), эмпирическое ожидание может быть дополнительно рассчитано:
Ep^[f(x)]=Δ
Затем мы можем добавить эти предварительные знания к ограничениям. Итак, максимальная энтропия
Это экспоненциальное семейное распределение. Можно сделать вывод, что,При условии выполнения установленных фактов максимальное распределение энтропии, соответствующее случайной величине, является экспоненциальным семейным распределением.
Несколько экспоненциальных семейных распределений
Несколько общих экспоненциальных семейных распределений представлены ниже.
Гауссово распределение
Если случайная величинаXподчиняться среднемуμ, дисперсияоГауссово распределение , обозначаемое как:X∼N(μ,о2)