Гипергеометрическое распределение
Материал из MachineLearning.
(в формуле сочетания поменять местами аргументы, плюс в знаменателе верхний аргумент - n) |
|||
(1 промежуточная версия не показана) | |||
Строка 48: | Строка 48: | ||
Если случайная величина <tex>X</tex> распределена гипергеометрически с параметрами <tex>N,\;m,\;n</tex>, тогда вероятность получить ровно <tex>k</tex> успехов (дефектных объектов в предыдущем примере) будет следующей: | Если случайная величина <tex>X</tex> распределена гипергеометрически с параметрами <tex>N,\;m,\;n</tex>, тогда вероятность получить ровно <tex>k</tex> успехов (дефектных объектов в предыдущем примере) будет следующей: | ||
- | ::<tex>f(k;N,m,n)=\frac{ | + | ::<tex>f(k;N,m,n)=\frac{C_m^k C_{N-m}^{n-k}}{C_N^n}</tex>. |
Эта вероятность положительна, когда <tex>k</tex> лежит в промежутке между <tex>\max \{ 0, D+n-N \} </tex> и <tex>\min\{ n,D \}</tex>. | Эта вероятность положительна, когда <tex>k</tex> лежит в промежутке между <tex>\max \{ 0, D+n-N \} </tex> и <tex>\min\{ n,D \}</tex>. | ||
Строка 58: | Строка 58: | ||
== Симметричность == | == Симметричность == | ||
::<tex> f(k;N,D,n) = {{{D \choose k} {{N-D} \choose {n-k}}}\over {N \choose n}} = f(n-k;N,N-D,n)</tex>, | ::<tex> f(k;N,D,n) = {{{D \choose k} {{N-D} \choose {n-k}}}\over {N \choose n}} = f(n-k;N,N-D,n)</tex>, | ||
+ | ::<tex> f(k;N,D,n) = f(D-k;N,D,N-n)</tex>, | ||
::<tex> f(k;N,D,n) = f(k;N,n,D) </tex>. | ::<tex> f(k;N,D,n) = f(k;N,n,D) </tex>. | ||
Текущая версия
Функция вероятности | |
Функция распределения | |
Параметры | |
Носитель | |
Функция вероятности | |
Функция распределения | |
Математическое ожидание | |
Медиана | |
Мода | |
Дисперсия | |
Коэффициент асимметрии | |
Коэффициент эксцесса | |
Информационная энтропия | |
Производящая функция моментов | |
Характеристическая функция |
Гипергеометрическое распределение — это дискретное вероятностное распределение, которое описывает количество успехов в выборке без возвращений длины над конечной совокупностью объектов.
Попали в выборку | Не попали в выборку | Всего | |
---|---|---|---|
С дефектом (успех) | |||
Без дефекта | |||
Всего |
Это выборка из объектов, из которых дефектных. Гипергеометрическое распределение описывает вероятность того, что именно дефектных в выборке из конкретных объектов, взятых из совокупности.
Если случайная величина распределена гипергеометрически с параметрами , тогда вероятность получить ровно успехов (дефектных объектов в предыдущем примере) будет следующей:
- .
Эта вероятность положительна, когда лежит в промежутке между и .
Приведенная формула может трактоваться следующим образом: существует возможных выборок (без возвращения). Есть способов выбрать бракованных объектов и способов заполнить остаток выборки объектами без дефектов.
В случае, когда размер популяции является большим по сравнению с размером выборки (т.е., намного больше, чем ), гипергеометрическое распределение хорошо аппроксимируется биномиальным распределением с параметрами (количество испытаний) и (вероятность успеха в одном испытании).
Симметричность
- ,
- ,
- .
Ссылки
http://en.wikipedia.org/wiki/Hypergeometric_distribution