Объясните запутанное распределение Пуассона с помощью «каштана».

математика

Эта статья возникла из личного публичного аккаунта:TechFlow, оригинальность это не просто, прошу внимания


СегодняЧасть 5 специальных тем по теории вероятностей и статистикеСтатья, появление этой статьи означает, что мы подошли к концу по теме высшей математики. Осталось много контента в большом количестве, например, множественное интегрирование, решение дифференциальных уравнений и так далее. Но для области алгоритмов базового исчисления в основном достаточно, поэтому мы не будем продолжать его расширять.Если в будущем будет связанный контент, мы откроем статью, чтобы поговорить об этом.

Содержание нашей статьи посвящено распределению Пуассона в статистике.


взять каштан


Распределение Пуассона очень важно в статистике вероятностей и может быть легко использовано для расчета некоторых вероятностей, которые рассчитать сложнее. Во многих книгах будет сказано, что распределение ПуассонаПо существу биномиальное распределение, распределение Пуассона используется только для упрощения вычисления биномиального распределения. Концептуально это верно, но нам, новичкам, трудно полностью понять суть этого.

Итак, давайте возьмем каштан, чтобы понять его с точки зрения непрофессионала.

Предположим, у нас есть каштан. Иногда из-за ветра или деятельности мелких животных каштаны могут падать с дерева. Очевидно, что это случайное событие, и вероятность возникновения очень мала, тогда мыКак найти его распределение вероятностей?? Распределение Пуассона решает такую ​​проблему.

Кажется, что нет модели, которая могла бы напрямую описать эту проблему, и необходимо сделать некоторые преобразования.

На самом деле, мы можем разделить событие и превратить эту задачу в задачу о биномиальном распределении.

Например, мы делим время суток на несколько частей, чтобы для каждого времени, упадут ли каштаны, было событие, которое произойдет. Таким образом, это становится проблемой биномиального распределения. Теоретически два каштана не упадут в одно и то же время, поэтомуПока мы делим время достаточно точно, мы можем гарантировать, что за определенный период времени упадет не более одного каштана.(В противном случае биномиальное распределение не выполняется).

Предположим, мы делим время суток на n частей и хотим узнать вероятность того, что за день упадет k каштанов, согласно формуле биномиального распределения, эта вероятность равна:

P(k)=C_n^k\cdot p^k(1-p)^{n-k}

На данный момент мы сделали солидный шаг вперед и написали выражение для вероятности.


Получите распределение Пуассона


Хотя у нас есть формула, она кажется бесполезной, потому что мы знаем только, что р — это вероятность падения каштанов в единицу времени, откуда мы знаем, насколько велика эта вероятность? Вы действительно собираетесь это измерять?

Чтобы решить эту проблему, мы должны вернуться к биномиальному распределению. Мы можем использовать биномиальное распределение, чтобы найти математическое ожидание количества каштанов, падающих каждый день.Очевидно, что в каждую единицу времени вероятность падения каштана равна p, поэтому общее математическое ожидание:

E(X) = np

Мы позволяем этому значению быть\lambda, то по этой формуле можно выразить р.

p=\frac{\lambda}{n}

Приводим эту формулу р к исходной формуле, можем получить:

P(k) = C_n^k \cdot {\frac{\lambda}{n}}^{k}(1-\frac{\lambda}{n})^{n-k}

Как упоминалось ранее, чтобы удовлетворить биномиальному распределению, мыНеобходимо, чтобы единица времени была как можно меньше, чтобы два каштана не упали одновременно. Таким образом, это n должно быть как можно больше.Мы можем использовать предел, который мы узнали ранее, чтобы сделать n стремящимся к бесконечности, поэтому эта проблема становится предельной проблемой.

\begin{aligned} P(k) = \lim_{n \to \infty}  C_n^k \cdot{\frac{\lambda}{n}}^{k}(1-\frac{\lambda}{n})^{n-k} \end{aligned}

Рассчитаем этот лимит:

\begin{aligned} P(k) &= \lim_{n \to \infty}  C_n^k \cdot{\frac{\lambda}{n}}^{k}(1-\frac{\lambda}{n})^{n-k} \\ &=  \lim_{n \to \infty} \frac{n(n-1)(n-2)\cdots(n-k+1)}{k!}{\frac{\lambda}{n}}^k(1-\frac{\lambda}{n})^{n-k} \\ &= \lim_{n \to \infty} \frac{\lambda^k}{k!} (1-\frac{\lambda}{n})^n\cdot \frac{n}{n} \cdot \frac{n-1}{n}\cdots \frac{n-k+1}{n} (1-\frac{\lambda}{n})^{-k} \end{aligned}

Разобьем этот предел на части, где:

\begin{aligned} \lim_{n \to \infty}\frac{n}{n} \cdot \frac{n-1}{n}\cdots \frac{n-k+1}{n} (1-\frac{\lambda}{n})^{-k} = 1 \end{aligned}
\begin{aligned} \lim_{n \to \infty}(1-\frac{\lambda}{n})^n &= \lim_{n\to \infty}\{(1+\frac{1}{-\frac{n}{\lambda}})^{-\frac{n}{\lambda}}\}^{-\lambda}\\ &= e^{-\lambda} \end{aligned}

Итак, подставляем, можем получить:

P(k) = \frac{\lambda^k}{k!}e^{-\lambda}

этоФункция плотности вероятности распределения Пуассона, то есть вероятность выпадения k примеров в день равна\frac{\lambda^k}{k!}e^{-\lambda}.

Другими словами, распределение Пуассона является результатом бесконечного деления времени, а затем применения биномиального распределения к математическому пределу. По сути,Его ядром по-прежнему является биномиальное распределение. Причина использования распределения Пуассона заключается в том, что при большом n и маленьком p нам будет очень трудно использовать вычисление биномиального распределения, потому что значение, рассчитанное по степени, будет очень большим.В настоящее время мы используем распределение Пуассона к Эту вероятность удобно аппроксимировать.


окончание и сублимация


Согласно полученным результатам, мы чувствуем, что пока n велико, а p мало, можно использовать распределение Пуассона. Но ведь это только перцептивное познание, и в статистике есть строгое определение этой проблемы. Давайте взглянем на ограничения строгих условий использования, которых, наверное, три.

  1. Когда мы делим время без проводов, вероятность события, происходящего в течение периода времени, близкого к 0, пропорциональна времени.
  2. В любой бесконечно малый период времени вероятность того, что одно и то же событие произойдет дважды, бесконечно близка к 0.
  3. Происходят ли события независимо друг от друга в разные периоды времени

Наконец, давайте посмотрим на пример в книге и на деле почувствуем применение распределения Пуассона. Предположим, у нас есть партия деталей с долей брака 0,1%, или 1 из 1000. Могу ли я спросить вероятность того, что мы произведем не менее двух бракованных изделий из тысячи изделий?

Эта задача должна быть очень простой, требуя вероятности двух или более бракованных изделий, нам просто нужно вычислить вероятность только деталей и одного бракованного, а затем вычесть их из 1. Сначала мы вычисляем из n и p\lambda:

\lambda = np = 1000 * 0.1% = 1

Приведем формулу распределения Пуассона:

P(k \geq 2) = 1 - P(k=1) - P(k=0) = 1 - \frac{1^1 e^{-1}}{1!} - \frac{1^0 e^{-1}}{0!}\approx 0.264

Если использовать для расчета биномиальное распределение, то нужно вычислять тысячную степень 0,999, что, очевидно, очень сложно, в чем и заключается смысл распределения Пуассона.

Сегодняшняя статья здесь, оригинальность не из легких,Подписывайтесь на меня, чтобы получать больше качественных статей