Биномиальное распределение

Материал из MachineLearning.

Версия от 08:09, 6 декабря 2012; Vitsemgol (Обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)

--Vitsemgol 11:09, 6 декабря 2012 (MSK)

**Биномиальное распределение**
Функция вероятности
Функция распределения
Параметры	$n \geq 0$ — число «испытаний» $0\leq p \leq 1$ — вероятность «успеха»
Носитель	$k \in \{0,\ldots,n\}\!$
Функция вероятности	${n \choose k}\,p^k q^{n-k} \!$
Функция распределения	$I_{1-p}(n-\lfloor k\rfloor, 1+\lfloor k\rfloor) \!$
Математическое ожидание	$np\!$
Медиана	одно из $\{[np]-1, [np], [np]+1\}$
Мода	$\lfloor (n+1)\,p\rfloor\!$
Дисперсия	$npq\!$
Коэффициент асимметрии	$\frac{1-2p}{\sqrt{npq}}\!$
Коэффициент эксцесса	$\frac{1-6pq}{npq}\!$
Информационная энтропия	$\frac12 \log_2 \big( 2\pi e\, np(1-p) \big) + O \left( \frac{1}{n} \right)$
Производящая функция моментов	$(q + pe^t)^n \!$
Характеристическая функция	$(q + pe^{it})^n \!$

Содержание

1 Традиционная интерпретация 20-го века
2 Определение
3 Основные свойства
4 Асимптотические приближения при больших
5 Литература
6 Ссылки
7 Настоящая интерпретация 21-го века
8 Биномиальная схема повторных циклов случайных зависимых экспериментов
- 8.1 Случайная величина биномиального распределения
9 Технические задачи и технические результаты
10 Биномиальное распределение — совместное распределение двух случайных величин ^[1]
11 Характер зависимости случайных величин в каждом цикле экспериментов:
12 Характеристики случайных величин биномиального распределения:
13 Характеристики биномиального распределения:
14 Математическое ожидание биномиального распределения
15 Биномиальное распределение как процесс выполнения взаимосвязанных действий над объектами
16 Сравнительная оценка характеристик биномиальных распределений настоящей и традиционной интерпретаций
17 Литература

Традиционная интерпретация 20-го века

Определение

Биномиальное распределение — дискретное распределение вероятностей случайной величины $X,$ принимающей целочисленные значения $k=0,1,\ldots,n$ с вероятностями:

$P(X=k)={n \choose k}p^k(1-p)^{n-k}.$

Данное распределение характеризуется двумя параметрами: целым числом $n>0,$ называемым числом испытаний, и вещественным числом $p,$ $0\le p\le 1,$ называемом вероятностью успеха в одном испытании. Биномиальное распределение — одно из основных распределений вероятностей, связанных с последовательностью независимых испытаний. Если проводится серия из $n$ независимых испытаний, в каждом из которых может произойти "успех" с вероятностью $p,$ то случайная величина, равная числу успехов во всей серии, имеет указанное распределение. Эта величина также может быть представлена в виде суммы $X=X_1+\cdots+X_n$ независимых слагаемых, имеющих распределение Бернулли.

Основные свойства

Характеристическая функция: $\phi(t)=(1+p(e^{it}-1))^n.$

Моменты:

Математическое ожидание: $MX=np.$
Дисперсия: $DX=np(1-p).$
Асимметрия: $\gamma_1=\frac{1-2p}{\sqrt{np(1-p)}};$ при $p=0.5$ распределение симметрично относительно центра $n/2.$

Асимптотические приближения при больших $n$

Если значения $n$ велики, то непосредственное вычисление вероятностей событий, связанных с данной случайной величиной, технически затруднительно. В этих случаях можно использовать приближения биномиального распределения распределением Пуассона и нормальным (приближение Муавра-Лапласа).

Приближение Пуассона

Приближение распределением Пуассона применяется в ситуациях, когда значения $n$ большие, а значения $p$ близки к нулю. При этом биномиальное распределение аппроксимируется распределением Пуассона с параметром $\lambda=np.$

Строгая формулировка: если $n\to\infty$ и $p\to 0$ таким образом, что $np\to\lambda,$ то

$P(X=k)\to\frac{\lambda^k}{k!}e^{-\lambda},\quad k=0, 1, 2, \ldots$

Более того, справедлива следующая оценка. Пусть $Y$ — случайная величина, имеющая распределение Пуассона с параметром $\lambda=np.$ Тогда для произвольного множества $B\subset\{0,1,2,\ldots\}$ справедливо неравенство:

$|P(X\in B) - P(Y\in B)|\le 2np^2.$

Доказательство и обзор более точных результатов, касающихся точности данного приближения, можно найти в [1, гл. III, §12].

Нормальное приближение

Приближение нормальным распределением используется в ситуациях, когда $n\to\infty,$ а $p$ фиксировано. Это приближение можно рассматривать как частный случай центральной предельной теоремы, применение которой основано на представлении $X$ в виде суммы $n$ слагаемых. Приближение основано на том, что при указанных условиях распределение нормированной величины

$X'=\frac{X-MX}{\sqrt{DX}}=\frac{X-np}{\sqrt{npq},$ где $q=1-p,$

близко к стандартному нормальному.

Локальная теорема Муавра-Лапласа

Данная теорема используется для приближенного вычисления вероятностей отдельных значений биномиального распределения. Она утверждает [1, гл. I, §6], что равномерно по всем значениям $k,$ таким что $|k-np|=o(npq)^{2/3},$ имеет место

$P(X=k)\sim\frac{1}{\sqrt{2\pi npq}}e^{-\frac{(k-np)^2}{2npq}}=\frac{1}{\sqrt{npq}}\varphi\left(\frac{k-np}{\sqrt{npq}}\right),$

где $\varphi$ — плотность стандартного нормального распределения.

Интегральная теорема Муавра-Лапласа

На практике необходимость оценки вероятностей отдельных значений, которую дает локальная теорема Муавра-Лапласа, возникает нечасто. Гораздо более важно оценивать вероятности событий, включающих в себя множество значений. Для этого используется интегральная теорема, которую можно сформулировать в следующем виде [1, гл. I, §6]:

$\sup_{-\infty\le a<b\le\infty}\left|P\left(a<\frac{X-np}{\sqrt{npq}}\le b\right) - P(a<Z\le b)\right|\to 0$ при $n\to\infty,$

где случайная величина $Y$ имеет стандартное нормальное распределение $\mathcal{N}(0,1),$ и аппроксимирующая вероятность определяется по формуле

$P(a<Z\le b)=\Phi(b)-\Phi(a),$

где $\Phi(t)$ — функция распределения стандартного нормального закона: $\Phi(t)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^t e^{-t^2/2}\,dt.$

Есть ряд результатов, позволяющих оценить скорость сходимости. В [1, гл. I, §6] приводится следующий результат, являющийся частным случаем теоремы Берри-Эссеена:

$\sup_{-\infty\le x\le\infty}|F_n(x)-\Phi(x)|\le\frac{p^2+q^2}{\sqrt{npq}},$

где $F_n(x)$ — функция распределения случайной величины $X'=\frac{X-np}{\sqrt{npq}}.$ На практике решение о том, насколько следует доверять нормальному приближению, принимают исходя из величины $npq.$ Чем она больше, тем меньше будет погрешность приближения.

Заметим, что асимптотический результат не изменится, если заменить строгие неравенства на нестрогие и наоборот. Предельная вероятность от такой замены также не поменяется, так как нормальное распределение абсолютно непрерывно и вероятность принять любое конкретное значение для него равна нулю. Однако исходная вероятность от такой замены может измениться, что вносит в формулу некоторую неоднозначность. Для больших значений $n$ изменение будет невелико, однако для небольших $n$ это может внести дополнительную погрешность.

Для устранения этой неоднозначности, а также повышения точности приближения рекомендуется задавать интересующие события в виде интервалов с полуцелыми границами. При этом приближение получается точнее. Это связано с тем интуитивно понятным соображением, что аппроксимация кусочно-постоянной функции (функции распределения биномиального закона) с помощью непрерывной функции дает более точные приближения между точками разрыва, чем в этих точках.

Пример

Пусть $n=20,$ $p=0.5.$ Оценим вероятность того, что число успехов будет отличаться от наиболее вероятного значения $10$ не более чем на $3$ . Заметим, что значение $npq=5$ очень мало, поэтому применение нормального приближения здесь довольно ненадежно.

Точная вероятность рассматриваемого события равна

$P(7\le X\le 13)\approx 0.8846.$

Применим нормальное приближение с той расстановкой неравенств, которая дана выше (снизу строгое, сверху нестрогое):

$P(7\le X\le 13)=P(6<X\le 13)=P\left(\frac{6-10}{\sqrt{5}}<\frac{X-np}{\sqrt{npq}}\le\frac{13-10}{\sqrt{5}}\right)=P\left(-\frac{4}{\sqrt{5}}<\frac{X-np}{\sqrt{npq}}\le\frac{3}{\sqrt{5}}\right)\approx P\left(-\frac{4}{\sqrt{5}}<Z\le\frac{3}{\sqrt{5}}\right)=\Phi\left(\frac{3}{\sqrt{5}}\right) - \Phi\left(-\frac{4}{\sqrt{5}}\right)\approx 0.8733.$

Ошибка приближения равна $0.0113$ .

Теперь построим приближение, используя интервал с концами в полуцелых точках:

$P(7\le X\le 13)=P(6.5<X< 13.5)=P\left(-\frac{3.5}{\sqrt{5}}<\frac{X-np}{\sqrt{npq}}\le\frac{3.5}{\sqrt{5}}\right)\approx P\left(-\frac{3.5}{\sqrt{5}}<Z\le\frac{3.5}{\sqrt{5}}\right)=\Phi\left(\frac{3.5}{\sqrt{5}}\right) - \Phi\left(-\frac{3.5}{\sqrt{5}}\right)\approx 0.8824.$

Ошибка приближения равна $0.0022$ — примерно в 5 раз меньше, чем в предыдущем подходе.

Литература

1. Ширяев А.Н. Вероятность. — М.: МЦНМО, 2004.

Ссылки

Биномиальное распределение (Википедия)
Binomial distribution (Wikipedia)

Настоящая интерпретация 21-го века

Биномиальное распределение традиционной интерпретации основано на трех ложных постулатах:

Биномиальное распределение — распределение одной случайной величины;
Биномиальное распределение появляется в последовательности независимых испытаний (экспериментов);

Математическое ожидание биномиального распределения равно $np$ , где $n$ - конечное число независимых испытаний с двумя взаимно исключающими исходами каждое: положительный исход 1 c вероятностью $p$ и отрицательный исход 0 с вероятностью $q=1-p$ .

Доказательство ложности постулатов ^[1], ^[1].

Теорема 1. Биномиальное распределение не является распределением одной случайной величины.

Доказательство.

Если энциклопедически известно ^[1], что биномиальное распределение является частным случаем традиционной интерпретации полиномиального распределения как совместного распределения вероятностей независимых $X_1,\ldots, X _k$ случайных величин при сокращении в нём числа $k$ случайных величин до двух, то подставляя условие $k=2$ в формулу традиционной интерпретации полиномиального распределения

$P(X_1=n_1,\ldots,X_k=n_k)= \frac{n!}{n_1!\cdots n_k!}p_1^{n_1}\cdots p_k^{n_k}$ ,

$2\le k \le n< \infty, \quad n_1+\ldots+n_k=n, \quad p_1+\ldots+p_k=1, \quad i=1,\ldots,k$ ,

получим формулу биномиального распределения не одной случайной величины, а двух случайных величин

$P(X_1=n_1, X_2=n_2)= \frac{n!}{n_1! n_2!} p_1^{n_1}p_2^{n_2}$ ,

$2\le k \le n< \infty, \quad n_1+n_2=n, \quad p_1+p_2=1$ ,

что и требовалось доказать.

Примечание.

Характер зависимости второй случайной величины от первой описан ниже.

Доказательство ложности второго и третьего постулатов.

Теорема 2. Биномиальное распределение не появляется в последовательности независимых испытаний (экспериментов) и его математическое ожидание не равно $np$ .

Доказательство.

Допустим, что

$np$

математическое ожидание биномиального распределения, появляющегося в последовательности независимых испытаний (экспериментов). Тогда при выполнении условия

$n>p^{-1}$

математическое ожидание этого распределения будет больше единицы, что противоречит аксиоматике Колмогорова, согласно которой сумма всех вероятностей распределения, включая и его математическое ожидание, должна быть равной единице.

Теорема 2 доказана.

Биномиальная схема повторных циклов случайных зависимых экспериментов

Каждый цикл экспериментов осуществляют методом выбора без возвращения в дискретной временной последовательности

$t_1, \quad t_2$ .

Каждая из случайных величин распределения

$X_i=n_i \mid X_{i-1}=n_{i-1}$

это $n_i$ наступлений одного события

$x_i, \quad i =1,2$

в $i$ - ый момент времени при условии, что в $(i-1)$ - ый момент произошло $n_{i-1}$ наступлений предшествующего события $x_{i-1}$ , — распределения Бернулли с успехом, вероятности которых $p_i$ нормированы

$p_1+p_2=1$

и неизменны во время проведения экспериментов.

Если в каждом цикле экспериментов вероятность наступления события $x_i$ равна $p_i$ , то биномиальная вероятность равна вероятности того, что при $n$ экспериментах события $x_1,\quad x_2$ наступят $n_1, \quad n_2$ раз соответственно.

Случайная величина биномиального распределения

в соответствующей точке дискретной временной последовательности $t_1, \quad t_2$ имеет:

пространство элементарных событий

$\Omega_i(t_i, X_i=n_i \mid t_{i-1},X_{i-1}=n_{i-1})= [0\le n_i \le n-n_{i-1}]$ ,

вероятность

$P(t_i, X_i=n_i \mid t_{i-1},X_{i-1}=n_{i-1})={n-n_{i-1}\choose n_i}p_i^{n_i}$ ,

математическое ожидание

$E(t_i, X_i=n_i \mid t_{i-1},X_{i-1}=n_{i-1})=( n-n_{i-1})p_i$

и дисперсию

$D(t_i,X_i \mid t_{i-},X_{i-1})=( n -n_{i-1})p_iq_i, \quad q_i=1-p_i$ .

Пространство элементарных событий биномиального распределения есть сумма точечных пространств элементарных событий его случайных величин, образующих дискретную последовательность точек $t_1,\quad t_2$ цикла, а вероятность биномиального распределения — произведение вероятностей его случайных величин.

Технические задачи и технические результаты

Для получения биномиального распределения необходимо решить две технические задачи и получить технические результаты, относящиеся к математической физике ^[1], ^[1].

Первая и вторая технические задачи — соответственно получение вероятности и математического ожидания биномиального распределения.

Технические результаты — набор технических параметров, с одной стороны, минимально необходимый для описания биномиального распределения и его случайных величин, с другой стороны, позволяющий при необходимости расширить число параметров с целью получения дополнительных сведений о распределении, например, таких как корреляционная матрица, ковариационная матрица и другие.

Минимально необходимый набор параметров при решении первой технической задачи: пространство элементарных событий, вероятность, математическое ожидание и дисперсия каждой случайной величины распределения, дисперсия распределения и произведение математических ожиданий его случайных величин как исходное выражение для решения второй технической задачи.

При решении второй технической задачи минимально необходимый набор параметров аналогичен предыдущему набору. Исключен из-за ненадобности один параметр — произведение математических ожиданий случайных величин и дополнен двумя параметрами — максимальной вероятностью и максимальной дисперсией биномиального распределения.

Биномиальное распределение — совместное распределение двух случайных величин ^[1]

$\prod_{i=1}^2P(t_i,X_i=n_i \mid t_{i-1},X_{i-1}=n_{i-1})=\frac{n!}{n_1! n_2!}p_1^{n_1} p_2^{n_2},\qquad \frac{n!}{n_1!n_2!}={n\choose n_1,n_2}= {n \choose n_1}={n\choose n_2}$ ,

$2\le k \le n <\infty, \qquad n_1+n _2=n, \qquad p_1+p_2=1$ ,

определённых на точечных пространствах элементарных событий

$\Omega_1, \quad \Omega _2$

и принимающих в дискретные последовательные моменты времени

$t_1,\quad t_2, \quad t_i<t_{i+1}$

целые неотрицательные значения

$n_1,\quad n_2$ ,

взаимосвязанные условием

$n_1 +n_2=n$ ,

согласно которому

$_2=n_2 \mid X_1=n_1$

если в первый момент времени $t_1$ первая случайная величина $X_1$ приняла значение

$n_1, \quad 0\le n_1\le n$ ,

то во второй момент времени $t_2$ вторая случайная величина $X _2$ принимает значение

$n _2, \quad 0\le n_2\le n- n_1$ .

Характер зависимости случайных величин в каждом цикле экспериментов:

только первая случайная величина является независимой, а вторая случайная величина зависима от первой;

если первая случайная величина в первый момент времени приняла своё максимально возможное значение, равное $X_1=n$ , то вторая случайная величина во второй момент времени обязана принять своё минимальное (нулевое) значение $X_2=n_2=0$ в противном случае не будет выполнено условие суммирования числовых значений случайных величин распределения, согласно которому $n_1+n _2=n$ ;

если первая случайная величина в первый момент времени приняла своё минимальное (нулевое) значение $X_1=n_1=0$ , то вторая случайная величина во второй момент времени обязана принять своё максимальное значение $X_2=n_2=n$ в противном случае не будет выполнено условие $n_1+n _2=n$ .

Характеристики случайных величин биномиального распределения:

пространство элементарных событий

$\Omega_i(t_i,X_i=n_i \mid t_{i-1},X_{i-1}=n_{i-1})=[0 \le n_i \le n-n_{i-1}]$ ,

вероятность

$P(t_i, X_i=n_i \mid t_{i-1},X_{i-1}=n_{i-1})={n-n_{i-1}\choose n_i}p_i^{n_i}$ ,

математическое ожидание

$E(t_i,X_i=n_i \mid t_{i-1},X_{i-1}=n_{i-1})=(n-n_{i-1})p_i$ ,

дисперсия

$D(t_i,X_i \mid t_{i-1},X_{i-1})=(n -n_{i-1})p_iq_i, \quad q_i=1-p_i$ ,

производящая

$A(s_i)=(1+p_is_i)^{n-n_{i-1}}$

и характеристическая

$f(t_i)=(1+p_ie^{jt_i})^{n-n_{i-1}}$

функции.

Характеристики биномиального распределения:

пространство элементарных событий

$\sum_{i=1}^2\Omega_i(t_i,X_i=n_i \mid t_{i-1},X_{i-1}=n_{i-1})$ ,

расположенное в точках $t_1, \quad t_2$ временной последовательности,

вероятность

$\prod_{i=1}^2P(t_i,X_i=n_i \mid t_{i-1},X_{i-1}=n_{i-1})=\frac{n!}{n_1!n_2!}p_1^{n_1}p_2^{n_2}$ ,

дисперсия

$\sum_{i=1}^2D(t_i,X_i \mid t_{i-1},X_{i-1})=\sum_{i=1}^2(n-n_{i-1})p_iq_i$ ,

ковариационная матрица $B=\| b_{ij} \|$ , где

$b_{ij} = \begin{cases} (n-n_{i-1})p_iq_i, & i=j,\\ 0, & i \not= j,\end{cases}$ ,

корреляционная матрица $P = \| \rho_{ij} \|$ , где

$\rho _{ij} = \begin{cases} 1, & i=j,\\0, & i \not= j,\end{cases}$

$\chi^2$ - квадрат критерий для полиномиально распределенных случайных величин

$\chi^2=\sum_{i=1}^2 [X_i-(n -n_{i-1})p_i^{(0)}]^2/(n -n_{i-1})p_i^{(0)}=$

$=-n+\sum_{i=1}^2X_i^2 /(n-n_{i-1})p_i^{(0)}$ .

Урновая модель биномиального распределения содержит одну исходную урну и две приёмные урны. В начальный момент времени исходная урна содержит $n$ - множество различимых неупорядоченных элементов, а приёмные урны пусты. Объем каждой из них не менее объёма исходной урны. Нумерация приёмных урн соответствует нумерации случайных величин биномиального распределения.

Первая выборка

$n_1,\quad 0\le n_1\le n$

в первый момент времени направляется в первую приёмную урну с вероятностью $p_1$ каждого элемента.

Во второй момент времени все оставшиеся $n-n_1$ элементы исходной урны, образующие вторую выборку

$n_2,\quad 0\le n-n_1\le n$ ,

направляются во вторую приёмную урну с вероятностью $p_2$ каждого элемента.

В результате исходная урна пуста, а все её элементы размещены в приёмных урнах.

После обработки результатов разбиения множества на подмножества элементы возвращают на прежнее место, и урновая модель готова к проведению очередного цикла зависимых экспериментов.

Произведение вероятностей попадания $n_1, \quad n_2$ элементов в две приёмные урны есть биномиальное распределение .

Математическое ожидание биномиального распределения

получают одним из двух способов: как максимум произведения математических ожиданий его случайных величин, или как максимум вероятности распределения.

Необходимые

$k=n, \qquad n_i=1, \qquad 0<p_i<1$

и достаточные

$p_1=p_2=2^{-1}$

условия получения математического ожидания биномиального распределения.

Математическое ожидание

$\left(\prod_{i=1}^2E(t_i,X_i=n_i \mid t_{i-1},X_{i-1}=n_{i-1})\right)_{max}=\left(\prod_{i=1}^2(n-n_{i-1})p_i\right)_{max}=\frac{n!}{n^n}=\frac{1}{2}$ ,

максимальная вероятность

$\left(\prod_{i=1}^2P(t_i, X_i=n_i \mid t_{i-1},X_{i-1}=n_{i-1})\right)_{max}=\left(\frac{n!}{n_i!n_2!}p_1^{n_1}p_2^{n_2}\right)_{max}= \frac{n!}{n^n}= \frac{1}{2}$

равна математическому ожиданию,

максимальная дисперсия

$D(X_1,X_2|X_1)_{max}=\left(\sum_{i-1}^2(n-n_{i-1})p_iq_i \right)_{max}=\frac{n^2-1}{2n}=\frac{3}{4}$ .

Пространство элементарных событий биномиального распределения при получении его математического ожидания

$\Omega(t_1, X_1=n_1=1 \mid t_2,X_2=n_2=1)$

расположено в точках $t_1, \quad t_2$ временной последовательности.

Урновая модель получения математического ожидания биномиального распределения содержит одну исходную урну и две приёмные урны единичных объемов. Нумерация приёмных урн соответствует нумерации случайных величин биномиального распределения.

В начальный момент времени исходная урна содержит два различимых элемента, а приёмные урны пусты.

В первый момент времени из исходной урны выбирают один элемент $n_1=1$ и направляют его в первую приёмную урну с вероятностью $p_1=0,5$ .

Во второй момент времени оставшийся элемент $n_2=1$ исходной урны отправляют во вторую приёмную урну с вероятностью $p_2=0,5$ .

В результате исходная урна пуста, а её два элемента по одному размещены в приёмных урнах. После обработки результатов разбиения исходного множества на два подмножества все элементы из приёмных урн возвращают в исходную урну. На этом один цикл повторных зависимых экспериментов закончен, и урновая модель готова к проведению следующего цикла экспериментов.

Произведение вероятностей попадания по одному произвольному элементу в каждую приёмную урну есть математическое ожидание биномиального распределения.

Изменение характеристик биномиального распределения в окрестности его математического ожидания приведено в таблице 1.

Таблица 1 – Окрестности математического ожидания биномиального распределения настоящей интерпретации 21-го века
Числовые значения первой случайной величины $X_1=n_1$	Числовые значения второй случайной величины $X_2=n_2\| X_1=n_1$	Вероятность распределения	Дисперсия распределения	Математическое ожидание распределения
1	1	0,50	0,75	0,50
2	0	0,25	0,50
0	2	0,25	0,50

Вероятность биномиального распределения как функция двух переменных является симметричной функцией относительно своего математического ожидания.

Биномиальное распределение как процесс выполнения взаимосвязанных действий над объектами

Объекты: множество, его подмножества и их элементы как объективная реальность, существующая вне нас и независимо от нас.

Биномиальное распределение это:

случайный процесс безвозвратного разделения последовательно во времени $t_1,\quad t_2$ и в пространстве конечного $n$ - множества различимых неупорядоченных элементов на две части $n_1, \quad n_2$ случайных объёмов, сумма которых равна объёму исходного множества: $n_1+ n_2=n, \quad 2\le n<\infty$ ,

разделение множества осуществляют выборками без возвращения (изъятые из множества элементы не возвращают обратно во множество до полного окончания экспериментов),

вероятность попадания одного произвольного элемента множества в каждое из подмножеств принимают за вероятность случайной величины распределения Бернулли с положительным исходом $0\le p_i<1, \quad i=1,2$ ,

результаты испытаний Бернулли неизменны во время проведения разбиения множества и пронормированы $\sum _{i=1}^2 p_i =1$ согласно аксиоматике Колмогорова,

очерёдность следования выборок принимают за очередность следования во времени и нумерацию случайных величин $X_1, \quad X_2$ биномиального распределения,

случайный объём каждой выборки $n_i, \quad i=1,2$ в момент времени $t_i, \quad i=1,2$ принимают за числовое значение соответствующей случайной величины $X_i=n_i, \quad i=1,2$ биномиального распределения,

первая случайная величина биномиального распределения является независимой и может принимать любое случайное значение в пределах от нуля до числового значения исходного множества $X_1=n_1, \quad 0\le n_1\le n<\infty$ ,

вторая случайная величина биномиального распределения принимает числовое значение $n_2$ , равное числу элементов множества оставшееся после изъятия из него первой выборкой случайного числа элементов $n_1: \quad n_2=n-n_1$ ,

результаты каждого разбиения обрабатывают вероятностными методами, определяют технические характеристике всех выборок и принимают их за технические характеристики случайных величин биномиального распределения,

минимально необходимый набор технических характеристик случайных величин и биномиального распределения в целом это: пространство элементарных событий, вероятность , математическое ожидание и дисперсия,

математическое ожидание биномиального распределения имеет место, когда число выборок $k$ равно числу элементов $n$ -множества $k=n$ и численно равно $\frac{n!}{n^n}=\frac{2!}{2^2}=\frac{1}{2}$ .

Сравнительная оценка характеристик биномиальных распределений настоящей и традиционной интерпретаций

Цель сравнительной оценки показать, что биномиальное распределение настоящей интерпретации (таблица 2) соответствует, а биномиальное распределение традиционной интерпретации (таблица 3) не соответствует современным требованиям аксиоматики Колмогорова.

Несоответствие состоит в том, что, во-первых, биномиальное распределение традиционной интерпретации представлено распределением одной случайной величины, а по своей сути и определению оно должно быть распределением двух случайных величин.

Во-вторых, при неограниченном увеличении числа независимых испытаний ( $n$ ) математическое ожидание ( $np$ ) биномиального распределения традиционной интерпретации устремляется к бесконечности, что недопустимо, поскольку сумма всех вероятностей распределения, включая и его математическое ожидание, в любом распределении обязана быть равной единице (см., например, таблицу 1). Кроме того, математическое ожидание ( $np_1$ ) и дисперсия ( $np_1q_1$ ) первой случайной величины биномиального распределения настоящей интерпретации (таблица 2) приняты за математическое ожидание ( $np$ ) и дисперсию ( $npq$ ) биномиального распределения традиционной интерпретации (таблица 3).

Таблица 2 – Характеристики биномиального распределения настоящей интерпретации 21-го века
Характеристики	Пространство элементарных событий	Вероятность	Математическое ожидание	Дисперсия
Распределение	$\sum_{i=1}^2\Omega_i(t_i,X_i=n_i \mid t_{i-1},X_{i-1}=n_{i-1})$	$\frac{n!}{n_1!n_2!}p_1^{n_1}p_2^{n_2}$	0,5	$n(p_1q_1+p_2q_2)$
Первая случайная величина распределения $X_1=n_1$	$t_1, \quad 0\le X_1=n_1\le n$	${n\choose n_1}p_1^{n_1}$	$np_1$	$np_1 q_1$
Вторая случайная величина $X_2=n_2 \mid X_1=n_1$	$t_2, \quad 0\le X_2=n_2=n-n_1\mid X_1=n_1\le n$	${n-n_1\choose n_2}p_2^{n_2}$	$(n-n_1)p_2$	$(n-n_1)p_2 q_2$

Таблица 3 – Основные характеристики биномиального распределения интерпретации 20-го века
Характеристики	Пространство элементарных событий	Вероятность распределения	Математическое ожидание распределения	Дисперсия распределения
Распределение	Произвольная последовательность $n$ независимых испытаний с двумя взаимоисключающими исходами каждый: исход 1 с вероятностью $p$ , исход 0 с вероятностью $1-p=q$	${n\choose k}p^kq^{n-k}, \quad 0\le k\le n$	$np, \quad 2\le n<\infty$	$npq, \quad q=1-p$

Историческая справка ^[1]

Литература

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%91%D0%B8%D0%BD%D0%BE%D0%BC%D0%B8%D0%B0%D0%BB%D1%8C%D0%BD%D0%BE%D0%B5_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5»

Категория: Вероятностные распределения

Биномиальное распределение

Материал из MachineLearning.

Содержание

Традиционная интерпретация 20-го века

Определение

Основные свойства

Асимптотические приближения при больших $n$

Приближение Пуассона

Нормальное приближение

Локальная теорема Муавра-Лапласа

Интегральная теорема Муавра-Лапласа

Пример

Литература

Ссылки

Настоящая интерпретация 21-го века

Биномиальная схема повторных циклов случайных зависимых экспериментов

Случайная величина биномиального распределения

Технические задачи и технические результаты

Биномиальное распределение — совместное распределение двух случайных величин ^[1]

Характер зависимости случайных величин в каждом цикле экспериментов:

Характеристики случайных величин биномиального распределения:

Характеристики биномиального распределения:

Математическое ожидание биномиального распределения

Биномиальное распределение как процесс выполнения взаимосвязанных действий над объектами

Сравнительная оценка характеристик биномиальных распределений настоящей и традиционной интерпретаций

Литература

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты

Биномиальное распределение

Материал из MachineLearning.

Содержание

Традиционная интерпретация 20-го века

Определение

Основные свойства

Асимптотические приближения при больших

Приближение Пуассона

Нормальное приближение

Локальная теорема Муавра-Лапласа

Интегральная теорема Муавра-Лапласа

Пример

Литература

Ссылки

Настоящая интерпретация 21-го века

Биномиальная схема повторных циклов случайных зависимых экспериментов

Случайная величина биномиального распределения

Технические задачи и технические результаты

Биномиальное распределение — совместное распределение двух случайных величин [1]

Характер зависимости случайных величин в каждом цикле экспериментов:

Характеристики случайных величин биномиального распределения:

Характеристики биномиального распределения:

Математическое ожидание биномиального распределения

Биномиальное распределение как процесс выполнения взаимосвязанных действий над объектами

Сравнительная оценка характеристик биномиальных распределений настоящей и традиционной интерпретаций

Литература

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты

Асимптотические приближения при больших $n$

Биномиальное распределение — совместное распределение двух случайных величин ^[1]