18-19 (1.2.1 Плотность вероятности)

искусственный интеллект

1.2.1 Плотность вероятности

   В дополнение к рассмотрению вероятностей, определенных для множеств дискретного времени, мы также хотим рассмотреть вероятности относительно непрерывных переменных. Мы ограничимся относительно неформальными дискуссиями. Если вещественная переменнаяxxпопасть в интервал(x,x+δx)(x,x+\delta x)Вероятность внутри определяется выражениемp(x)δxp(x)\delta xвыражатьδx0\delta x\rightarrow 0,Такp(x)p(x)называетсяxxПлотность вероятности на . Как показано на рисунке 1.12.xxв интервале(a,b)(a,b)Вероятность внутри определяется как:

p(xе(a,b))=abp(x)dx(1.24)p(x\in(a,b))=\int_a^bp(x)dx\tag{1.24}

потому что вероятность неотрицательна и потому чтоxxЗначение должно лежать где-то на действительной оси, поэтому плотность вероятностиp(x)p(x)Оба условия должны быть соблюдены

p(x)0(1.25)p(x)\geq0\tag{1.25}
p(x)dx=1(1.26)\int_{-\infty}^\infty p(x)dx=1\tag{1.26}

При нелинейных заменах переменных плотность вероятности преобразуется иначе, чем простые функции, из-за фактора Якоби. Например, если мы рассмотрим переменнуюx=g(y)x=g(y)изменяется, то функцияf(x)f(x)статьf(y)=f(g(y))f(y)=f(g(y)). Теперь рассмотрим плотность вероятностиpx(x)p_x(x), что соответствует переменной относительно новогоyyплотностьpy(y)p_y(y), что достаточно для представленияpx(x)p_x(x)иpy(y)p_y(y)это факт разной плотности. для меньшегоδx\delta xстоимость в(x,x+δx)(x,x+\delta x)Наблюдения в пределах диапазона будут преобразованы в(y,y+δy)(y,y+\delta y)диапазон, гдеpx(x)δxpy(y)δyp_x(x)\delta x \simeq p_y(y)\delta yтак что

P(z)=zp(x)dx(1.28)P(z)=\int_{-\infty}^zp(x)dx\tag{1.28}

это удовлетворяетP'(x)=p(x)P'(x)=p(x), как показано на рисунке 1.12.

Figure 1.12

Рис. 1.12. Вероятность дискретных переменных. Вероятность можно разложить на непрерывные переменные.xxплотность вероятности наp(x)p(x), и пусть он лежит в интервале(x,δx)(x,\delta x)изxxВероятность определяется выражениемδx\delta xизp(x)δxp(x)\delta xдаватьδx0\delta x\rightarrow0. Плотность вероятности может быть выражена как кумулятивная функция распределенияP(x)P(x)производная от .

   Если у нас есть несколько непрерывных переменныхx1,...,xDx_1,...,x_D, с векторомxxпредставляет, то мы можем определить совместную плотность вероятностиp(x)=p(x1,...,xD)p(x)=p(x_1,...,x_D)такой, что x попадает в содержащую точкуxxбесконечно малый объемδx\delta xВероятность вp(x)δxp(x)\delta xданный. Эта многомерная плотность вероятности должна удовлетворять

p(x)0(1.29)p(x)\geq0\tag{1.29}
p(x)dx=1(1.30)\int p(x)dx=1\tag{1.30}

где интеграл для всегоxxКосмический интеграл. Мы также можем рассмотреть комбинацию совместных распределений вероятностей по дискретным и непрерывным переменным.

   Обратите внимание, что еслиxxявляется дискретной переменной, тоp(x)p(x)иногда называют функцией массы вероятности, потому что ее можно рассматривать как наборxx​Вероятностная масса при допустимых значениях.

Правило произведения суммы вероятностей и теорема Байеса также применяются в случае плотности вероятности или комбинации дискретных и непрерывных переменных. Например, еслиxxиyyдве действительные переменные, то форма правила суммирования и правила произведения

p(x)=p(x,y)dy(1.31)p(x)=\int p(x,y)dy\tag{1.31}
p(x,y)=p(yx)p(x)(1.32)p(x,y)=p(y|x)p(x)\tag{1.32}

Формальные доказательства правила произведения суммы непрерывных переменных требуют раздела математики, называемого теорией измерения, и выходят за рамки этой книги. Однако его эффективность можно увидеть неформально, разделив каждую реальную переменную на интервалы шириныΔ\DeltaРассмотрим дискретные распределения вероятностей на этих интервалах. дойти до пределаΔ0\Delta\rightarrow0Затем сумма преобразуется в интеграл и дает желаемый результат.