Биномиальное распределение
Материал из MachineLearning.
м (→Нормальное приближение) |
(дополнение) |
||
Строка 2: | Строка 2: | ||
''Биномиальное распределение'' - дискретное распределение вероятностей [[случайная_величина|случайной величины]] <tex>X</tex>, принимающей целочисленные значения <tex>k=0,1,\ldots,n</tex> с вероятностями: | ''Биномиальное распределение'' - дискретное распределение вероятностей [[случайная_величина|случайной величины]] <tex>X</tex>, принимающей целочисленные значения <tex>k=0,1,\ldots,n</tex> с вероятностями: | ||
- | <tex>P(X=k)=C_n^kp^k(1-p)^{n-k}</tex>. | + | <center><tex>P(X=k)=C_n^kp^k(1-p)^{n-k}</tex>.</center> |
Данное распределение характеризуется двумя параметрами: целым числом <tex>n>0</tex>, называемым ''числом испытаний'', и вещественным числом <tex>p</tex>, <tex>0\le p\le 1</tex>, называемом ''вероятностью успеха в одном испытании''. Биномиальное распределение - одно из основных распределений вероятностей, связанных с последовательностью независимых испытаний. Если проводится серия из <tex>n</tex> независимых испытаний, в каждом из которых может произойти "успех" с вероятностью <tex>p</tex>, то случайная величина, равная числу успехов во всей серии, имеет указанное распределение. Эта величина также может быть представлена в виде суммы <tex>X=X_1+\cdots+X_n</tex> независимых слагаемых, имеющих [[распределение Бернулли]]. | Данное распределение характеризуется двумя параметрами: целым числом <tex>n>0</tex>, называемым ''числом испытаний'', и вещественным числом <tex>p</tex>, <tex>0\le p\le 1</tex>, называемом ''вероятностью успеха в одном испытании''. Биномиальное распределение - одно из основных распределений вероятностей, связанных с последовательностью независимых испытаний. Если проводится серия из <tex>n</tex> независимых испытаний, в каждом из которых может произойти "успех" с вероятностью <tex>p</tex>, то случайная величина, равная числу успехов во всей серии, имеет указанное распределение. Эта величина также может быть представлена в виде суммы <tex>X=X_1+\cdots+X_n</tex> независимых слагаемых, имеющих [[распределение Бернулли]]. | ||
Строка 25: | Строка 25: | ||
Строгая формулировка: если <tex>n\to\infty</tex> и <tex>p\to 0</tex> таким образом, что <tex>np\to\lambda</tex>, то | Строгая формулировка: если <tex>n\to\infty</tex> и <tex>p\to 0</tex> таким образом, что <tex>np\to\lambda</tex>, то | ||
- | <tex>P(X=k)\to\frac{\lambda^k}{k!}e^{-\lambda},\quad k=0,1,2,\ldots.</tex> | + | <center><tex>P(X=k)\to\frac{\lambda^k}{k!}e^{-\lambda},\quad k=0,1,2,\ldots.</tex></center> |
Более того, справедлива следующая оценка. Пусть <tex>Y</tex> - случайная величина, имеющая распределение Пуассона с параметром <tex>\lambda=np</tex>. | Более того, справедлива следующая оценка. Пусть <tex>Y</tex> - случайная величина, имеющая распределение Пуассона с параметром <tex>\lambda=np</tex>. | ||
Тогда для произвольного множества <tex>B\subset\{0,1,2,\ldots\}</tex> справедливо неравенство: | Тогда для произвольного множества <tex>B\subset\{0,1,2,\ldots\}</tex> справедливо неравенство: | ||
- | <tex>|P(X\in B) - P(Y\in B)|\le 2np^2.</tex> | + | <center><tex>|P(X\in B) - P(Y\in B)|\le 2np^2.</tex></center> |
Доказательство и обзор более точных результатов, касающихся точности данного приближения, можно найти в [1, гл. III, §12]. | Доказательство и обзор более точных результатов, касающихся точности данного приближения, можно найти в [1, гл. III, §12]. | ||
Строка 37: | Строка 37: | ||
Приближение нормальным распределением используется в ситуациях, когда <tex>n\to\infty</tex>, а <tex>p</tex> фиксировано. Это приближение можно рассматривать как частный случай центральной предельной теоремы, применение которой основано на представлении <tex>X</tex> в виде суммы <tex>n</tex> слагаемых. Приближение основано на том, что при указанных условиях распределение нормированной величины | Приближение нормальным распределением используется в ситуациях, когда <tex>n\to\infty</tex>, а <tex>p</tex> фиксировано. Это приближение можно рассматривать как частный случай центральной предельной теоремы, применение которой основано на представлении <tex>X</tex> в виде суммы <tex>n</tex> слагаемых. Приближение основано на том, что при указанных условиях распределение нормированной величины | ||
- | <tex>X'=\frac{X-MX}{\sqrt{DX}}=\frac{X-np}{\sqrt{npq}</tex>, где <tex>q=1-p</tex> | + | <center><tex>X'=\frac{X-MX}{\sqrt{DX}}=\frac{X-np}{\sqrt{npq}</tex>, где <tex>q=1-p</tex></center> |
близко к стандартному нормальному. | близко к стандартному нормальному. | ||
Строка 44: | Строка 44: | ||
Данная теорема используется для приближенного вычисления вероятностей отдельных значений биномиального распределения. Она утверждает [1, гл. I, §6], что равномерно по всем значениям <tex>k</tex>, таким что <tex>|k-np|=o(npq)^{2/3}</tex>, имеет место | Данная теорема используется для приближенного вычисления вероятностей отдельных значений биномиального распределения. Она утверждает [1, гл. I, §6], что равномерно по всем значениям <tex>k</tex>, таким что <tex>|k-np|=o(npq)^{2/3}</tex>, имеет место | ||
- | <tex>P(X=k)\sim\frac{1}{\sqrt{2\pi npq}}e^{-\frac{(k-np)^2}{2npq}}=\frac{1}{\sqrt{npq}}\varphi\left(\frac{k-np}{\sqrt{npq}}\right),</tex> где <tex>\varphi</tex> - плотность стандартного нормального распределения. | + | <center><tex>P(X=k)\sim\frac{1}{\sqrt{2\pi npq}}e^{-\frac{(k-np)^2}{2npq}}=\frac{1}{\sqrt{npq}}\varphi\left(\frac{k-np}{\sqrt{npq}}\right),</tex></center> |
+ | |||
+ | где <tex>\varphi</tex> - плотность стандартного нормального распределения. | ||
===Интегральная теорема Муавра-Лапласа=== | ===Интегральная теорема Муавра-Лапласа=== | ||
+ | На практике необходимость оценки вероятностей отдельных значений, которую дает локальная теорема Муавра-Лапласа, возникает не часто. Гораздо более важно оценивать вероятности событий, включающих в себя множество значений. Для этого используется интегральная теорема, которую можно сформулировать в следующем виде [1, гл. I, §6]: | ||
+ | |||
+ | <center><tex>\sup_{-\infty\le a<b\le\infty}\left|P\left(a<\frac{X-np}{\sqrt{npq}}\le b\right) - P(a<Z\le b)\right|\to 0</tex> при <tex>n\to\infty</tex>,</center> | ||
+ | |||
+ | где случайная величина <tex>Y</tex> имеет стандартное нормальное распределение <tex>\mathcal{N}(0,1)</tex>, и аппроксимирующая вероятность определяется по формуле | ||
+ | |||
+ | <center><tex>P(a<Z\le b)=\Phi(b)-\Phi(a)</tex></center>, | ||
+ | |||
+ | где <tex>\Phi(t)</tex> - функция распределения стандартного нормального закона: <tex>\Phi(t)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^t e^{-t^2/2}\,dt</tex>. | ||
+ | |||
+ | Есть ряд результатов, позволяющих оценить скорость сходимости. В [1, гл. I, §6] приводится следующий результат, являющийся частным случаем теоремы Берри-Эссеена: | ||
+ | |||
==Литература== | ==Литература== |
Версия 12:09, 4 ноября 2009
Содержание |
Определение
Биномиальное распределение - дискретное распределение вероятностей случайной величины , принимающей целочисленные значения с вероятностями:
Данное распределение характеризуется двумя параметрами: целым числом , называемым числом испытаний, и вещественным числом , , называемом вероятностью успеха в одном испытании. Биномиальное распределение - одно из основных распределений вероятностей, связанных с последовательностью независимых испытаний. Если проводится серия из независимых испытаний, в каждом из которых может произойти "успех" с вероятностью , то случайная величина, равная числу успехов во всей серии, имеет указанное распределение. Эта величина также может быть представлена в виде суммы независимых слагаемых, имеющих распределение Бернулли.
Основные свойства
- Математическое ожидание:
- Дисперсия:
- Асимметрия: ; при распределение симметрично относительно центра
Асимптотические приближения при больших n
Если значения велики, то непосредственное вычисление вероятностей событий, связанных с данной случайной величиной, технически затруднительно. В этих случаях можно использовать приближения биномиального распределения распределением Пуассона и нормальным (приближение Муавра-Лапласа).
Приближение Пуассона
Приближение распределением Пуассона применяется в ситуациях, когда значения большие, а значения близки к нулю. При этом биномиальное распределение аппроксимируется распределением Пуассона с параметром .
Строгая формулировка: если и таким образом, что , то
Более того, справедлива следующая оценка. Пусть - случайная величина, имеющая распределение Пуассона с параметром . Тогда для произвольного множества справедливо неравенство:
Доказательство и обзор более точных результатов, касающихся точности данного приближения, можно найти в [1, гл. III, §12].
Нормальное приближение
Приближение нормальным распределением используется в ситуациях, когда , а фиксировано. Это приближение можно рассматривать как частный случай центральной предельной теоремы, применение которой основано на представлении в виде суммы слагаемых. Приближение основано на том, что при указанных условиях распределение нормированной величины
близко к стандартному нормальному.
Локальная теорема Муавра-Лапласа
Данная теорема используется для приближенного вычисления вероятностей отдельных значений биномиального распределения. Она утверждает [1, гл. I, §6], что равномерно по всем значениям , таким что , имеет место
где - плотность стандартного нормального распределения.
Интегральная теорема Муавра-Лапласа
На практике необходимость оценки вероятностей отдельных значений, которую дает локальная теорема Муавра-Лапласа, возникает не часто. Гораздо более важно оценивать вероятности событий, включающих в себя множество значений. Для этого используется интегральная теорема, которую можно сформулировать в следующем виде [1, гл. I, §6]:
где случайная величина имеет стандартное нормальное распределение , и аппроксимирующая вероятность определяется по формуле
где - функция распределения стандартного нормального закона: .
Есть ряд результатов, позволяющих оценить скорость сходимости. В [1, гл. I, §6] приводится следующий результат, являющийся частным случаем теоремы Берри-Эссеена:
Литература
1. Ширяев А.Н. Вероятность. — М.: МЦНМО, 2004.
Ссылки
- Биномиальное распределение (Википедия)
- Binomial distribution (Wikipedia)