Биномиальное распределение

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (Определение)
(Асимптотические приближения при больших n)
Строка 18: Строка 18:
Если значения <tex>n</tex> велики, то непосредственное вычисление вероятностей событий, связанных с данной случайной величиной, технически затруднительно.
Если значения <tex>n</tex> велики, то непосредственное вычисление вероятностей событий, связанных с данной случайной величиной, технически затруднительно.
-
В этих случаях можно использовать приближения данного распределения распределением Пуассона и нормальным (приближение Муавра-Лапласа).
+
В этих случаях можно использовать приближения биномиального распределения распределением Пуассона и нормальным (приближение Муавра-Лапласа).
'''Приближение распределением Пуассона''' применяется в ситуациях, когда значения <tex>n</tex> большие, а значения <tex>p</tex> близки к нулю. При этом биномиальное распределение аппроксимируется распределением Пуассона с параметром <tex>\lambda=np</tex>.
'''Приближение распределением Пуассона''' применяется в ситуациях, когда значения <tex>n</tex> большие, а значения <tex>p</tex> близки к нулю. При этом биномиальное распределение аппроксимируется распределением Пуассона с параметром <tex>\lambda=np</tex>.

Версия 07:42, 3 ноября 2009

Содержание

Определение

Биномиальное распределение - дискретное распределение вероятностей случайной величины X, принимающей целочисленные значения k=0,1,\ldots,n с вероятностями:

P(X=k)=C_n^kp^k(1-p)^{n-k}.

Данное распределение характеризуется двумя параметрами: целым числом n>0, называемым числом испытаний, и вещественным числом p, 0\le p\le 1, называемом вероятностью успеха в одном испытании. Биномиальное распределение - одно из основных распределений вероятностей, связанных с последовательностью независимых испытаний. Если проводится серия из n независимых испытаний, в каждом из которых может произойти "успех" с вероятностью p, то случайная величина, равная числу успехов во всей серии, имеет указанное распределение. Эта величина также может быть представлена в виде суммы X=X_1+\cdots+X_n независимых слагаемых, имеющих распределение Бернулли.

Основные свойства

Характеристическая функция \phi(t)=(1+p(e^{it}-1))^n

Моменты:

  • Математическое ожидание: MX=np
  • Дисперсия: DX=np(1-p)
  • Асимметрия: \gamma_1=\frac{1-2p}{\sqrt{np(1-p)}}; при p=0.5 распределение симметрично относительно центра n/2

Асимптотические приближения при больших n

Если значения n велики, то непосредственное вычисление вероятностей событий, связанных с данной случайной величиной, технически затруднительно. В этих случаях можно использовать приближения биномиального распределения распределением Пуассона и нормальным (приближение Муавра-Лапласа).

Приближение распределением Пуассона применяется в ситуациях, когда значения n большие, а значения p близки к нулю. При этом биномиальное распределение аппроксимируется распределением Пуассона с параметром \lambda=np.

Строгая формулировка: если n\to\infty и p\to 0 таким образом, что np\to\lambda, то

P(X=k)\to\frac{\lambda^k}{k!}e^{-\lambda},\quad k=0,1,2,\ldots.

Более того, справедлива следующая оценка. Пусть Y - случайная величина, имеющая распределение Пуассона с параметром \lambda=np. Тогда для произвольного множества B\subset\{0,1,2,\ldots\} справедливо неравенство:

|P(X\in B) - P(Y\in B)|\le np^2.

Ссылки

Личные инструменты