Участник:Vitsemgol/Парадоксы биномиального распределения

Материал из MachineLearning.

Перейти к: навигация, поиск
Уважаемые коллеги!

Эта статья изобилует грубыми математическими ошибками (начиная с непонимания самой сути математического доказательства), как и другие статьи того же автора:

Удалить это безобразие и забанить автора — самое простое решение. Есть и другой вариант — попробовать помочь всем миром и написать коллективную рецензию, объяснив автору его ошибки. Для этого есть страницы Обсуждений статей и Обсуждение участника:Vitsemgol. Это большая работа, непосильная для одного человека, но для сообщества вполне осуществимая. Коллеги, давайте отнесёмся к проблеме как к исследованию. Есть несколько открытых вопросов, которые бросают нам вызов. Упрощает ли Вики задачу интегрирования «непризнанного гения» в профессиональное сообщество? Способен ли человек, ворвавшийся в чужой монастырь со своим уставом, покаяться и услышать, что ему скажут? Откликнется ли хоть кто-то из сообщества? Хватит ли нам всем терпимости? Это добрый эксперимент, дорогие коллеги! Как Администратор, предупреждаю: увижу «войну правок», эмоции и прочие проявления непрофессионализма — прекращу эксперимент как неудачный и удалю всё. — К.В.Воронцов 02:48, 4 ноября 2013 (MSK)

Уважаемый Константин Вячеславович и уважаемые Ваши единомышленники:

1. В начале этого года Главный администратор Викизнании Vovkаv проявил собственную инициативу и из моей Песочницы на Викизнании перенес на свою страницу обсуждения под №43 мою статью с названием "Кто в этом доме хозяин", посвящённую в основном современному представлению биномиального распределения;

2. То, что это распределение двух случайных величин знал ещё Виктор Яковлевич Буняковский в 1846 году! [1];

3. Однако с середины 20-го века возобладала иная точка зрения на биномиальное распределение, как на распределение одной случайной величины! [2]

4. Мои дебаты с моим оппонентом Zer0 закончились только весной 2013-го года. Был рассмотрен широкий круг вопросов по биномиальному и мультиномиальному (полиномиальному) распределениям. Моя основная точка зрения состояла в том, что в биномиальном распределении вторая случайная величина зависима от первой (иначе не выполнялась бы аксиома Колмогорова - нормирование вероятностей), а в мультиномиальном распределении только первая случайная величина является независимой, а все остальные случайные величины зависимы от всех предшестующих случайных величин своего распределения;

5. Летом 2013 года предварительно с Главным администратором Викизнании Vovkаv (см. его страницу обсуждения № 47) были согласованы названия всех вариантов биномиального и мультиномиального распределений: "vovkav 20:39, 19 <августа> 2013 (MSD): Предложенные названия статей одобряю.";

6. В августе 2013 года были написаны две статьи "Парадоксы биномиального распределения" и "Парадоксы мультиномиального (полиномиального) распределения";

7. И далее, к этим двум главным статьям в разделах См. также добавлены варианты названий биномиального и мультиномиального (полиномиального) распределений, которые были предложены совместными усилиями с Главным администратором Викизнании vovkav.

8. Кто-то перевёл мою статью «Биномиальное распределение» на украинский язык “Біноміальній розподіл”: http://choroshinovyny.info/p-11169-b%D1%96nom%D1%96alniy-rozpod%D1%96l Замечу, что В.Я. Буняковский украинец по отцовской линии, а я - по материнской линии. И если я не ошибаюсь, то первая книга по теории вероятностей была издана в Харькове в 1831 году. Пожалуйста, проверьте меня.

9. Всегда готов выслушать и принять любую критику.

09:59, 12 ноября 2013 (MSK)

4-го ноября 2013-го года Вы, Константин Вячеславович, всем миром захотели написать коллективную рецензию на мои работы и объяснить мне мои ошибки (если они имеются). Заодно Вы, Константин Вячеславович, спрашивали своих коллег: способен ли человек, ворвавшийся в чужой монастырь со своим уставом (как понял, это обо мне), покаяться и услышать, что ему скажут (а почему бы и нет)? Хватит ли нам всем терпимости (этот вопрос уже не ко мне)? Однако, заканчивается 5-й месяц как Вы, Константин Вячеславович, написали это и другое, но до сих ни Вы, ни Ваши коллеги на эти и другие вопросы так и не ответили. Спрашивается о каких таких моих ошибках Вы собирались вести речь? Для того, чтобы разъяснить свою точку зрения по данному вопросу (чего мелочиться?), обратимся к признанному гению А. С. Пушкину. В первой главе своего бессмертного творения “Евгений Онегин” автор, как признанный гений, сетовал на то, что (цитирую ) <<Латынь из моды вышла ныне>>. И это в 1831-м году! А что говорить нам в 2014-м году? Как известно, приставка <<би>> в переводе с латыни на русский язык означает двойной, сдвоенный. Поэтому слово бином означает двучлен. По аналогии биномиальное распределение означает распределение, содержащее ДВЕ случайные величины. А что мы имеем с 20-го века? С 20-го века и в 21-м веке биномиальное распределение – это распределение не двух, а одной случайной величины. Это первый маразм (на мой взгляд), занесенный к нам из США ещё в 20-м веке и получивший широкое распространение в 21-м веке [2]! Обратимся к одному из русских классиков 19-го века – к Виктору Яковлевичу Вуняковскому и прочитаем хотя бы первые 20 страниц в подлиннике [1]. В этой книге биномиальное распределение (ещё так не называемое) является распределением ДВУХ случайных величин! Так сколько же на самом деле случайных величин в биномиальном распределении? Две или одна? Если одна, то утверждающий в подлиннике не читал Буняковского. И, в конце концов, в свете вышеизложенного, объясните, пожалуйста, как биномиальное распределение одновременно может быть и распределением Бернулли, и биномиальным распределением? Иными словами, как может быть такое, что два различные распределения соответствуют одному и тому же назначению и описываются одной и той же формулой?

1.1. Вкратце определю свою точку зрения: биномиальное распределение – распределение двух случайных величин, в котором первая случайная величина независимая, а вторая случайная величина зависима от первой (иначе не будет выполняться вторая аксиома Колмогорова, - аксиома нормирования вероятностей). Вероятность биномиального распределения как произведение первой независимой и второй зависимой случайных величин является цепью Маркова. Сумма вероятностей биномиального распределения равна единице. Следовательно, биномиальное распределение как цепь Маркова, является стахостической. Переходная вероятность биномиального распределения является дискретной функцией времени.

2.1. Получение биномиального распределения относится к задачам разделения исходного конечного дискретного множества последовательно во времени на два подмножества случайных объёмов, в сумме составляющих исходное множество.

2.2. По аналогии получение мультиномиального распределения относится к задачам разделения дискретного множества последовательно во времени на несколько подмножеств (больше двух, но не больше числа элементов множества), в сумме составляющих исходное множество. Следовательно, мультиномиальное распределение является марковским процессом с дискретным временем.

3.1. Почти год как эта точка зрения изложена, частности, в трёх электронных энциклопедиях: ВИКИЗНАНИЕ http://www.wikiznanie.ru/ru-z/index.php/Парадоксы Биномиального распределения; МАТЕМАТИКА на сайте http://ru.math.wikia.com/wiki/Парадоксы биномиального распределения; НАУКА на сайте http://ru.science.wikia.com/wiki/Биномиальное распределение: парадоксы и временно вызывала сомнения в основном только у одного читателя Zer0 энциклопедии ВИКИЗНАНИЕ, о чём я уже писал ранее.

3.2. Я искренне благодарен участнику Yury Chekhovich за то, что он вынес несколько моих работ на обсуждение в проект «MachineLearning», и буду признателен за любые критические замечания в мой адрес. Ибо всю жизнь руководствуюсь мудростью своего школьного учителя по математике Николая Амплеевича, часто повторявшего: «Не ошибается тот, кто ничего не делает», и реже добавлял: «И ошибается в том, что нечего не делает».

Искренне жду Ваших замечаний и предложений.

C уважением, В. С. Голоборщенко 13:34, 7 апреля 2014 (MSD)


Содержание

Литература

  1. Буняковский В. Я. ОСНОВАНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ сочинение В. Я. БУНЯКОВСКОГО, ИМПЕРАТОРСКОЙ АКАДЕМИИ НАУК, ОРДИНАРНОГО АКАДЕМИКА, ПРОФЕССОРА С. ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА, ДОКТОРА МАТЕМАТИЧЕСКИХ НАУК ПАРИЖСКОЙ АКАДЕМИИ. САНКТПЕТЕРБУРГ. В Типографии Императорской Академии Наук. 1846. 477 с.
  2. Феллер В. Введение в теорию вероятностей и ее приложения. Том 1, перевод с англ. М.: Мир, 1984, 528с.


История

"История теории вероятности содержит очень много неожиданных парадоксов. По мнению Карла Пирсона, в математике нет другого такого раздела науки, в котором так же легко совершить ошибку": см. Биномиальное распределение – 1.doc; http://gendocs.ru/v1345/Биномиальное распределение. (МИНИСТЕРСТВО РФ ПО СВЯЗИ И ИНФОРМАТИЗАЦИИ. РЕФЕРАТ по дисциплине : «Теория вероятностей» на тему: «Биномиальное распределение» Выполнил: студентка группы АБ-87 Нецветаев Т.М. Новосибирск, 2010); http://www.vixri.ru/d/Sekej%20G.%20_Paradoksy%20v%20teorii%20verojatnostej_.pdf (Секей Габор. Парадоксы в теории вероятностей и математической статистике. Будапешт, 1988. 215 С. Цитата на С. 10).

Биномиальное и полиномиальное (мультиномиальное) распределения зарождались в первой половине XIX века, когда руководящей философской идеей развития теории вероятностей было убеждение во всеобщности понятия независимости. Авторы того времени, вплоть до конца XIX века, как правило, не оговаривали это предположение [1].

Известны были только условно независимые (неравновозможные) события. Если “…встречались не все равновозможны, - пояснял В. Я. Буняковский - то чрез дробление на другие, оне могут быть приведены к равновозможным…” [2].

С появлением цепей Маркова в начале XX века (1906-1907), к сожалению, не была пересмотрена концепция этих распределений.

Парадокс 20-го века: Распределение Бернулли и биномиальное распределение — это одно и тоже и каждое из них — распределение одной случайной величины в последовательности независимых испытаний

<< БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ, распределение Бернулли [3], — распределение вероятностей случайной величины X с целочисленными значениями m=0,1, \ldots,n, заданное формулой

p_m=P(X=m) =C_n^mp^m (1-p)^{n-m}

где n\ge1 и 0\le p\le 1 — параметры, а C_n^m — биномиальный коэффициент (отсюда название Б. р. ). Б. р. — одно из основных распределений вероятностей, связанных с последовательностью независимых испытаний; это — распределение вероятностей числа наступлений некоторого события (<<удачи>> ) в  n повторных независимых испытаниях, если при каждом испытании вероятность наступления этого события равна  p (см. Бернулли испытания). В соответствии с этим каждую случайную величину X, имеющую Б. р. с параметрами  n и  p можно представить в виде суммы  n независимых случайных величин, имеющих Б. р. с параметрами  n=1 и  p. Математическое ожидание и дисперсия случайной величины X с Б. р. равны EX=np и DX=np(1-p). Многомерным обобщением Б. р. служит полиномиальное распределение. >> Конец цитаты. Эти распределения аналогично описаны и в Большой Российской энциклопедии [4]. В начале 21-го века стало известно, что распределение Бернулли — это самостоятельное распределение в последовательности независимых испытаний. Оно почти одинаково описано в трёх электронных энциклопедиях Викизнание, Наука и Математика: Случайная величина X имеет распределение Бернулли, если она принимает всего два значения: 1 и 0 с вероятностями p и q\equiv 1-p соответственно. Таким образом:

\mathbb{P}(X=1) = p,
\mathbb{P}(X=0) = q.

Схема Бернулли стала известна и впервые была описана в энциклопедии Математика: Последовательность \{X_n\}_{n=1}^{\infty} независимых случайных величин, имеющих распределение Бернулли, называется схемой Бернулли. Физически схема Бернулли моделирует многократное проведение независимых реализаций одного и того же случайного эксперимента с двумя исходами: успех и неудача. Случайное событие \{X_i=1\} соответствует успеху в результате i-го испытания, а событие \{X_i=0\} соответствует неудаче ( http://ru.math.wikia.com/wiki/распределение Бернулли). Тем не менее, и в 21-ом веке можно встретить устаревшие суждения, подобные этому: http://wiki.bks-tv.ru/wiki/Обсуждение: Биномиальное_ распределение: Формула биномиального распределения и формула Бернулли - это одно и то же или нет? -- 10:41, 14 июня 2008 (UTC) Да.109.161.126.71 10:59, 8 ноября 2010 (UTC)

Парадокс первого десятилетия 21-го века: Биномиальное распределение — распределение одной случайной величины в конечной последовательности испытаний Бернулли

Во всех областях научного знания за исключением теории вероятностей приставка би (в переводе с латинского означающая сдвоенный, состоящий из двух частей) используется правильно, например, в авиации биплан самолет со сдвоенными крыльями, в оптике бинокль — сдвоенный монокль, в комбинаторике бином — двучлен, и только в современной теории вероятностей биномиальное распределение — распределение, полученное не основе бинома (двучлена), является распределением одной случайной величины…

Парадокс заключается в том, что http://wikipedia.ru/wiki/биномиальное распределение традиционной интерпретации 20-го века признаётся распределением одной случайной величины, а на самом деле биномиальное распределение является распределением двух случайных величин, в котором первая случайная величина является независимой, а вторая зависима от первой.

Этот парадокс возник из-за ошибки в логике рассуждений и получил повсеместное распространение с середины 20-го века.

Подобно тому, как из полинома (из многочлена) методом дедукции получают бином (двучлен), а из бинома методом индукции получают полином, так и по аналогии из полиномиального распределения (из мультиномиального распределения с числом случайных величин больше двух) методом дедукции обязаны получить биномиальное распределение (распределение с двумя случайными величинами), а из биномиального распределения (из распределения с двумя случайными величинами) методом индукции обязаны получить полиномиальное распределение (распределение с числом случайных величин больше двух).

Этот парадокс настолько распространён и настолько прост, что может быть проиллюстрирован на элементарных примерах. 1. Пусть в полиноме 10 членов. Сократив в нём число членов до двух, получим два:10:5=2.

2. В биноме 2 члена. Умножив их на 5, получим, что в полиноме 10 членов: 2х5=10.

3. Пусть в полиномиальном распределении 10 случайных величин. Сократив число случайных величин до двух, по аналогии обязаны получить биномиальное распределение с двумя случайными величинами: 10:5=2. Однако принято считать, что биномиальное распределение это распределение одной случайной величины, иными словами, если 10 разделить на 5, то получится один! Это первый парадоксальный результат: 10:5=1.

4. Число случайных величин биномиального распределения традиционной интерпретации, равное одному, умножив на 5 получим, что в полиномиальном распределении 5 случайных величин: 1х5=5. Это второй парадоксальный результат, поскольку изначально исходили из того, что в полиномиальном распределении 10 случайных величин.

Во времена В. Я. Буняковского биномиальное распределение, как распределение двух случайных величин и на его основе полиномиальное распределение (оба так ещё не называемые) впервые были опубликованы им в 1846 году [2].

В современной записи биномиальное и полиномиальное распределения Буняковского имеют следующий вид:

P(X_1=n_1, X_2=n_2)= \frac{n!}{n_1! n_2!} p_1^{n_1}p_2^{n_2},
2=k \le n< \infty, \quad n_1+n_2=n, \quad p_1+p_2=1;


P(X_1=n_1,\ldots,X_k=n_k)=\frac{n!}{n_1!\cdots n_k!}p_1^{n_1}\cdots p_k^{n_k},
2\le k \le n < \infty,\quad n_1+\ldots+n_k=n.

Парадокс второго десятилетия 21-го века: Биномиальное распределение — распределение одной случайной величины, содержащей ровно k успешно завершившихся испытаний Бернулли

См., например, Галанов Ю. И. Биномиальное распределение и его предельные формы http://hm.tpu.ru/geologi/galanov/lab_mathstat/lb1/bin0.htm 29 Биномиальное распределение -YouTube http://www.youtube.com/watch?v=vKOCLpNt1vM Изучение биномиального распределения - Exponennta.ru http://www.exponenta.ru/educat/systemat/shelomovsky/lab/lab03.asp Биномиальное распределение и его аппроксимация http://ofim.oscsbras.ru/~klokov/probability/simulations/approx.htm Ровно k означает только k и ни чего иного: ни больше, ни меньше, ни n-k неудачно завершённых испытаний, о чём подробно было рассмотрено в предыдущем парадоксе. Не биномиальное распределение, а распределение Пуассона определяет ровно k прошедших событий, причём параметр, определяющий среднее значение \lambda=pn, это ни что иное как математическое ожидание первой случайной величины биномиального распределения! Если в последовательности n испытаний Бернулли k испытаний окончилось успешно с вероятностью p_1 каждого, а n-k испытаний в той же последовательности окончилось неудачно с вероятностью p_2, \quad p_1+p_2=1 каждого, то вероятность того, что k испытаний окончилось успешно, равна числу сочетаний {n \choose k} из n по k, умноженному на p_1 вероятность k успешно окончившегося одного испытания, возведённую в степень k числа уснешно завершённых испытаний: {n\choose k}p_1^k. И это есть ни что иное, как вероятность P_1( X_1=n_1) первой случайной величины, распределения двух случайных величин. Аналогично, если в той же последовательности n испытаний Бернулли n-k испытаний окончилось неудачно с вероятностью p_2, \quad p_1+p_2=1 каждого, то вероятность того, что n-k из n-k испытаний окончились неудачно равна числу сочетаний из n-k по n-k {n-k \choose n-k}=1, умноженному на вероятность p_2 неудачно окончившегося испытания, возведённую в степень n-k числа неудачно завершённых испытаний: p_2^{(n-k)} . Это есть P_2(X_2=n_2) вероятность второй случайной величины биномиального распределения. Произведение вероятностей первой и второй случайных величин есть вероятность биномиального распределения — распределения двух случайных величин. Зависимость второй от первой случайной величины будет показана ниже. Здесь же главное то, что p_1n это математическое ожидание P_1( X_1=n_1) первой случайной величины биномиального распределения — распределения двух случайных величин. Математическое ожидание p_1n определяет равно k успешно окончившихся испытаний в последовательности n испытаний Бернулли. И эта величина аналогична \lambda=pn в распределении Пуассона, которая определяет среднее значение (ровно k событий) случайной величины.

Биномиальное распределение как задача разделения дискретного целого на две составные части

Разделение дискретного целого на две составные части случайного объёма осуществляют в последовательные моменты времени. Дискретное целое  n, \quad 2\le n <\infty — множество дискретных элементов. Элементы различимы между собой хотя бы одним признаком и не упорядочены (хаотично расположены). Разделение множества на два подмножества осуществляют методом выбора без возвращения — выбранные элементы множества не возвращают во множество до полного его разделения (изъятия из него элементов). Выбор произвольного элемента множества равновероятен и равен p_i=n^{-1}, \quad i=1,\ldots,n. В начальный момент времени t_0 , не обязательно равный нулю t_0 \ne 0, множество содержит n, 2\le n < \infty различимых неупорядоченных элементов. В первый момент времени t_1,\quad t_1>t_0 из исходного множества, содержащего n, \quad 2\le n<\infty элементов, осуществляют выборку случайного объёма  n_1, \quad 0\le n_1\le n элементов множества. Вероятность первой случайной величины X_1, принявшей в первый момент времени t_1 числовое значение n_1, равна числу сочетаний {n \choose n_1} из n по n_1, умноженному на вероятность выбора одного элемента p_1=n^{-1}, возведённого в степень n_1 — числа выбранных элементов

P_1(t_1,X_1=n_1)={n \choose n_1}p_1^{n_1}.

Во второй момент времени t_2\quad t_2>t_1 вторая случайная величина X_2 вынуждена принять единственно возможное значение n_2=n-n_1, поскольку в первый момент времени t_1 первая случайная величина X_1 приняла числовое значение n_1. Условная вероятность второй случайной величины P_2(t_2,X_2=n_2 \mid t_1,X_1=n_1) равна числу сочетаний {n-n_1 \choose n_2=n-n_1}= {n-n_1 \choose n-n_1}=1 из n-n_1 по n_2=n-n_1, умноженному на вероятность выбора одного элемента p_2=n^{-1}, возведённого в степень n_2— числа выбранных элементов

P_2(t_2,X_2=n_2 \mid t_1,X_1=n_1)=p_2^{n_2}.

Произведение вероятностей первой и второй случайных величин есть вероятность биномиального распределения Таким образом, биномиальное распределение — это распределение двух случайных величин, в котором первая случайная величина является действительно независимой, а вторая зависима от первой.

Биномиальное распределение как процесс выполнения взаимосвязанных действий над объектами

Объекты: множество, его подмножества и их элементы как объективная реальность, существующая вне нас и независимо от нас. Биномиальное распределение это:

  • случайный процесс безвозвратного разделения последовательно во времени  t_1,\quad t_2 и в пространстве конечного  n- множества различимых неупорядоченных элементов на две части  n_1, \quad n_2 случайных объёмов, сумма которых равна объёму исходного множества:  n_1+ n_2=n, \quad 2\le n<\infty ,
  • разделение множества осуществляют выборками без возвращения (изъятые из множества элементы не возвращают обратно во множество до полного окончания экспериментов),
  • вероятность попадания одного произвольного элемента множества в каждое из подмножеств  0\le p_i<1, \quad i=1,2 принимают за вероятность успеха (успешного завершения испытания) распределения Бернулли,
  • вероятности успехов Бернулли распределения нормируют  \sum _{i=1}^2 p_i =1 согласно аксиоматике Колмогорова,
  • очерёдность следования выборок принимают за нумерацию случайных величин биномиального распределения,
  • случайный объём каждой выборки  n_i, \quad i=1,2 в момент времени  t_i, \quad i=1,2 принимают за числовое значение соответствующей случайной величины  X_i=n_i, \quad i=1,2 биномиального распределения,
  • результаты каждого разбиения обрабатывают вероятностными методами, определяют технические характеристике всех выборок и принимают их за технические характеристики случайных величин биномиального распределения,
  • минимально необходимый набор технических характеристик случайных величин и биномиального распределения в целом это: пространство элементарных событий, вероятность , математическое ожидание и дисперсия,
  • математическое ожидание биномиального распределения имеет место, когда число выборок k равно числу элементов  n-множества  k=n и численно равно  \frac{n!}{n^n}=\frac{2!}{2^2}=\frac{1}{2}.

Биномиальное распределение как простейшая цепь Маркова

Биномиальное распределение появляется в последовательности двух испытаний, первое из них случайное независимое, а второе зависимое от первого испытания. Исходы испытаний конечны и счётны. По сути — это простейшая цепь Маркова. (X_0, называемое начальным распределением цепи Маркова, для биномиального распределения не имеет смысла t_0=0, \quad X_0=0, поскольку нумерация случайных величин начинается с единицы.) Единственная переходная вероятность заключается в том, что вторая случайная величина X_2 во второй момент времени t_2 вынуждена принять числовое значение, равное  0\le n_2=n-n_1 , при условии, что в первый момент времени t_1 первая случайная величина X_1 приняла случайное число  0\le n_1\le n. Следовательно и вероятность биномиального распределения

\prod_{i=1}^2P(t_i,X_i=n_i \mid t_{i-1},X_{i-1}=n_{i-1})=\frac{n!}{n_1! n_2!}p_1^{n_1}p_2^{n_2}

как произведение первой независимой и второй зависимой случайных величин является цепью Маркова. Сумма вероятностей биномиального распределения равна единице. Следовательно, биномиальное распределение как цепь Маркова, является стахостической.

Переходная вероятность биномиального распределения является дискретной функцией. Следовательно, биномиальное распределение является марковским процессом с дискретным временем.

Наиболее интересные этапы становлнения биномиального и мультиномиального распределений

Начальный этап становления биномиального распределения

Зарождение биномиальное распределение зарождалось как комбинаторная задача на основе разложения бинома (a + b)^n

Принцип полной индукции восходит к древним грекам, например, к “Началам” Евклида, а в странах ислама формула бинома (a + b)^n при n=3,4,\ldots,9 была известна уже в 10-12 веках таким учёным, как: Ат-Туси, Ал-Каши и Омар Хайям.

Первый из них (Абу Джафар Мухаммад ибн Мухаммад Насир ад-Дин ат-Туси) Ат-Туси (1201- 26 июня 1274) уроженец города Туса в Хорасане, работал сначала в столице государства ассасинов. Ат-Туси принадлежит много трудов по математике и астрономии, а также по физике, минералогии, логике, этике и другим наукам. [5]

В «Сборнике по арифметике с помощью доски и пыли» (1265) Ат-Туси подробно описал приём извлечения корней любой степени и привел таблицу биномиальных коэффициентов в форме треугольника, известного ныне как треугольник Паскаля [6].

Последний из них владел правилом возведения двучлена в любую целую положительную степень. Однако эти сочинения Хайяма пока не найдены. Но на их существование говорит его цитата: “Мы покажем, как определить основания квадрато–квадратов, квадрато–кубов, кубов–кубов и так далее сколько угодно, чего раньше не было”. По-видимому, эти общие результаты в словесном изложении не дошли в своё время до Европы, и здесь пришлось их получать заново .

Первая половина 19-го века - дальнейшее теоретическое и практическое применение бинома Ньютона в теории вероятностей

Процитируем [7] и проанализируем урновую модель Лапласа: <<Предположим, что урна содержит a белых и b черных шаров, и что по изъятии из неё шара, его кладут обратно в урну: спрашивается, какова вероятность того, что при n тиражах будут вынуты m белых шаров и n-m черных. Ясно, что число случаев возможных при каждом тираже равно a плюс b . Так как каждый случай второго тиража может комбинироваться со всеми случаями первого, то число случаев возможных при двух тиражах, равно квадрату бинома a плюс b . В разложении этого квадрата квадрат a выражает число случаев, в которых два раза вынут белый шар, удвоенное произведение a на b выражает число случаев, в которых вынуты белый и черный шары; наконец, квадрат b выражает число случаев, в которых вынуты два черных шара. Продолжая таким образом дальше, находят вообще, что n -я степень бинома a плюс b выражает число всех случаев возможных при n тиражах, и что в разложении этой степени член, умноженный на m -ю степень a выражает число случаев, в которых можно вынуть m белых шаров и n-m черных. Поэтому, деля этот член на всю степень бинома, получим вероятность изъятия m белых шаров и n-m черных. Так как отношения a и a плюс b есть вероятность изъятия белого шара, а отношение b и a плюс b есть вероятность изъятия черного шара, если при этом назовем эти вероятности p и q , то вероятностью изъятия m белых шаров при n тиражах будет член, умноженный на -ю степень , в разложении n -й степени бинома p плюс q  : легко заметить, что сумма p плюс q есть единица. Это замечательное свойство бинома оказывается очень полезным в теории вероятностей>>.

Примечания. 1. В современной теории вероятностей тиражом называют одно независимое повторное испытание с двумя несовместными исходами каждый (испытание Бернулли), что в модели Лапласа, например, означает: “успешный исход” случайного события A=1 — вынут белый шар, “неудачный исход” случайного события A=0 — вынут черный шар.

2. Процедура изъятия из урны одного произвольного шара и каждый раз возвращение его в урну до следующего изъятия со времён Лапласа закрепилась в теории вероятностей как метод выбора с возвращением получения бинома и вероятностей биномиального распределения (ещё так не называемого).

3. Возникли существенные различия биномиальных распределений, полученных на основе двух рассмотренных биномов a плюс b в степени n и p плюс q в степени n, связанных одним тождеством

\frac{(a+b)^n}{(a+b)^n}=1^n=(p+q)^n, \qquad p=\frac{a}{a+b}, \qquad q= \frac{b}{a+b}.

Из дроби \frac{(a+b)^n}{(a+b)^n} Лаплас определил вероятность биномиального распределения как вероятность изъятия m белых шаров и n-m черных:

P(a=m,b=n-m)= \frac {{n\choose m}a^mb^{n-m}}{(a+b)^n},

а из бинома (p+q)^n — вероятность биномиального распределения как вероятность изъятия m только белых шаров

P(a=m)= {n\choose m}p^mq^{n-m}.

В России в 1846 году В. Я. Буняковский на основе комбинаций исходов независимых испытаний получил вероятность биномиального распределения, как распределения двух случайных величин [8] . Однако это осталось незамеченным возможно потому, что Буняковский опубликовал свою работу только на русском языке и в очень ограниченном количестве экземпляров. А при жизни Лапласа его трактат был опубликован пять раз: в феврале и ноябре 1814, 1816, 1819 и 1825 годах. Кроме того, в последствии трактат и его переводы неоднократно переиздавались во многих странах вплоть до конца XX века. В США последний раз был переиздан в 1994 году, а в России — в 1999 году в составе энциклопедии.

Опыт философии в теории вероятностей [9] — образец гениальности Лапласа. Он изложил полную теорию на то время, привел полный свод истин из теории вероятностей и приложений анализа вероятностей без применения формул и сложных вычислений.

В первой половине 19-го века В. Я. Буняковский назвал труд Лапласа бессмертным творением утверждая, что никому аналитическая Теория Вероятностей не обязана столько, как Лапласу.

Только в начале 20-го века появились первые критические высказывания в адрес трактата Лапласа, вспоминал Г. Крамер полвека спустя [10]

Видимо сказался авторитет Лапласа, и, как следствие, многие столетия развитие биномиального распределения шло в направлении распределения одной случайной величины.

В СССР, даже в середине 20-го века эта точка зрения не ставилась под сомнение. В качестве примера процитируем вышедший в 1956 году в Издательстве АН СССР 3-томный коллективный труд “Математика, ее содержание, методы и значения”. В нём говорится, что глава XI — Теория вероятностей — из 2-го тома этого труда, написанная академиком А. Н. Колмогоровым , до наших дней сохраняет интерес для представителей естественнонаучных и инженерных специальностей, учителей математики [11]

Цитируем из неё с несущественными изменениями обозначений: <<Вычислим теперь вероятность P_k ровно  k появлений некоторого события A в n независимых испытаниях, в каждом из которых вероятность p этого события одна и та же.

Обозначим через \vee событие, заключающееся в непоявлении события A.

Очевидно, что

P(\vee)=1-P(A)=1-p.

Из независимости испытаний нетрудно усмотреть, что вероятность какой-либо определенной последовательности, составленной из k появлений A и n-k непоявлений , равна

p^k(1-p)^{n-k}.

Так, например, при n=5 и k=2 вероятность получить последовательность исходов будет

p(1-p)p(1-p)(1-p) =p^2(1-p)^3.

По теореме сложения вероятность P_k равна сумме вероятностей всех последовательностей с  k появлений и с n- k непоявлений события A , т. е. в силу

p^k(1-p)^{n-k}

равна произведению числа таких последовательностей на p^k(1-p)^{n-k} . Число таких последовательностей, очевидно, равно числу сочетаний из n по k , поскольку k положительных исходов могут занимать в ряду n испытаний любые k мест.

Окончательно получаем

P_k= C_n^kp^k(1-p)^{n-k} \qquad  (k=0,\ldots,n).

(так наз. биномиальное распределение) >> Конец цитаты.

Проанализируем получение Колмогоровым биномиального распределения.

Во-первых, была поставлена задача вычислить вероятность ровно k появлений одного и того же случайного события в последовательности, содержащей n независимых испытаний.

Во-вторых, в процессе решения поставленной задачи дополнительно была вычислена вероятность ровно n-k появлений и второго случайного события в той же последовательности, а именно, вероятность непоявления первого случайного события. Иными словами, была вычислена совместная вероятность появления двух случайных событий на едином пространстве элементарных событий, представляющем собой последовательность n независимых испытаний.

И, наконец, в-третьих, произведение вероятности ровно k появлений одного и вероятности ровно n-k непоявлений другого случайного события было принято за вероятность ровно k появлений первого случайного события в последовательности независимых испытаний:

P_k= C_n^kp^k(1-p) ^{n-k} \qquad  (k=0,\ldots,n).

По Колмогорову так называемое биномиальное распределение есть распределение одной случайной величины, появляющейся ровно k раз, причём эта точка зрения существует и в настоящее время.

Распределение Пуассона

P_k=e^{-\lambda}\frac{\lambda^k}{k!},

в котором \lambda=np, на самом деле определяет вероятность ровно k появлений того же случайного события в последовательности n независимых испытаний [12], причем параметр \lambda=np есть математическое ожидание первой случайной величины биномиального распределения (и полиномиального распределения тоже) настоящей интерпретации.

В. Я. Буняковский в 1846 году первым в мире получил формулу вероятности биномиального распределения как распределения двух случайных величин. В ту пору не были известными многие современные математические знаки такие, как суммирование, произведение, факториал и другие. В современной записи Биномиальное распределение Буняковского выглядит следующим образом:

P(X_1=n_1, X_2=n_2)= \frac{n!}{n_1! n_2!} p_1^{n_1}p_2^{n_2},
2=k \le n< \infty, \quad n_1+n_2=n, \quad p_1+p_2=1.

В том же 1846 году В. Я. Буняковский методом индукции распространил математическую формулу разложения бинома “на случай сколь угодно большого числа событий”, тем самым получил новое тождество

\frac{(a+b+c+\ldots)^n}{(a+b+c+\ldots)^n }=1^n=(p_1+p_2+p_3+\ldots)^n,

в котором

\frac{a}{a+b+c+\ldots}, \quad \frac{b}{a+b+c+\ldots}, \quad \frac{c}{a+b+c+\ldots},

из которого В. Я. Буняковский первым в мире получил и формулу вероятности полиномиального распределения традиционной интерпретации (независимых случайных величин).

В современной записи Мультиномиальное распределение независимых случайных величин (Мультиномиальное распределение Буняковского) выглядит следующим образом:

P(X_1=n_1,\ldots,X_k=n_k)=\frac{n!}{n_1!\cdots n_k!}p_1^{n_1}\cdots p_k^{n_k},
2\le k \le n< \infty, \quad n_1+\ldots+n_k=n, \quad  p_1+ \ldots +p_ k =1.

Заключение

По числу парадоксов (3) биномиальное распределение уступает только мультиномиальному (полиномиальному) распределению (как минимум 5). Главные причины возникновения парадоксов — ошибки в логике и в методе его получения. В частности, биномиальное не потому что его формула содержит биномиальные коэффициенты, а потому что оно первоначально было получено из бинома (двучлена), именно поэтому обязано быть распределением двух случайных величин, о чём было известно В. Я. Буняковскому ещё 1846 году! Это же почти доказал и Лаплас в 1812 году [13], [14].

Новое — это хорошо забытое старое.

На самом деле биномиальное распределение получают в процессе разбиения множества различимых и неупорядоченных элементов на два подмножества случайных объёмов, в сумме составляющих исходное множество. Число подмножеств равно числу случайных величин распределения. Процесс разбиения множества осуществляют последовательно во времени методом выбора без возвращения .

Главным распространителем парадоксов биномиального и мультиномиального распределений является Википедия, которая нарушает заодно и свои правила ВП МАРГ: http://ru.wikipedia.org/wiki/Биномиальное распределение и http://ru.wikipedia.org/wiki/Мультиномиальное распределение (не представлен ни один авторитетный источник).

Пришло время, когда биномиальное распределение и мультиномиальное распределение описаны на единой методологической основе:

методом индукции от биномиального распределения приходим к мультиномиальному;

методом дедукции от мультиномиального распределения приходим к биномиальному.

Если и найдётся человек-чудак, который всерьёз будет утверждать, что << биномиальное распределение — это распределение одной случайной величины, полученное методом выбора с возвращением >>, поприветствуем его как человека из прошлого века.

Литература

  1. История математики, т. 2. Математика XV11 века. М.: Наука, 1970, 300 С.
  2. Буняковский В. Я. ОСНОВАНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ сочинение В. Я. БУНЯКОВСКОГО, ИМПЕРАТОРСКОЙ АКАДЕМИИ НАУК, ОРДИНАРНОГО АКАДЕМИКА, ПРОФЕССОРА С. ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА, ДОКТОРА МАТЕМАТИЧЕСКИХ НАУК ПАРИЖСКОЙ АКАДЕМИИ. САНКТПЕТЕРБУРГ. В Типографии Императорской Академии Наук. 1846. 477 с.
  3. Биномиальное распределение. Математический энциклопедический словарь. / Гл. ред. Ю. В Прохоров; Ред. кол. С. И. Адян, Н. С. Бахвалов, В. И. Батюцков, А. П. Ершов, Л. Д. Кудрявцев, А. Л. Онищик, А. П. Юшкевич. - М.: Сов. энциклопедия, 1988. С.95.
  4. Большев Л. Н. Биномиальное распределение. Вероятность и математическая статистика: Энциклопедия / Гл. ред. Ю. В. Прохоров.- М.: Большая Российская энциклопедия, 1999. С. 49-50. ISBN 5-85270-265-X
  5. История математики. Том 1. С древних времён до начала нового времени. М.: Наука, 1970. 351 с.
  6. http://wikipedia.ru/wiki/Математика исламского средневековья
  7. Вероятность и математическая статистика: Энциклопедия / Гл. ред. Ю. В. Прохоров, 1999. - 910 с. ISBN 585270265X
  8. Буняковский В. Я. Основания математической теории вероятностей. Сочинение Императорской Академии Наук ординарного академика, профессора С.Петербургского университета и доктора математических наук Парижской Академии. САНКТПЕТЕРБУРГ, Типография Императорской Академии Наук. СПб. 1846. 477 с.
  9. Laplace P. Essai philosophique sur les probabilités. Paris, 1812. (Опыт философии теории вероятностей). Пер. с фр. A.I.B., под ред. А. К. Власова, М.: Московский университет, 1908.
  10. Крамер Г. Полвека с теорией вероятностей: наброски воспоминаний. Современные проблемы математики. М.: Знание. 1979. 60 с.
  11. Математика, её содержание, методы и значения Том. 2.М. АН СССР. 1956.
  12. Феллер В. Введение в теорию вероятностей и её приложения. Том 1. перевод с англ. М.: Мир, 1984. 528 с. C. 173
  13. Laplace P. Essai philosophique sur les probabilités. Paris, 1812. (Опыт философии теории вероятностей). Пер. с фр. A.I.B., под ред. А. К. Власова, М.: Московский университет, 1908.
  14. Лаплас П. Опыт философии теории вероятностей. // Вероятность и математическая статистика: Энциклопедия. М.: Большая Российская энциклопедия, 1999. С. 834-863. ISBN 585270265X

См.также

Личные инструменты