Гипергеометрическое распределение
Материал из MachineLearning.
м |
(в формуле сочетания поменять местами аргументы, плюс в знаменателе верхний аргумент - n) |
||
Строка 48: | Строка 48: | ||
Если случайная величина <tex>X</tex> распределена гипергеометрически с параметрами <tex>N,\;m,\;n</tex>, тогда вероятность получить ровно <tex>k</tex> успехов (дефектных объектов в предыдущем примере) будет следующей: | Если случайная величина <tex>X</tex> распределена гипергеометрически с параметрами <tex>N,\;m,\;n</tex>, тогда вероятность получить ровно <tex>k</tex> успехов (дефектных объектов в предыдущем примере) будет следующей: | ||
- | ::<tex>f(k;N,m,n)=\frac{ | + | ::<tex>f(k;N,m,n)=\frac{C_m^k C_{N-m}^{n-k}}{C_N^n}</tex>. |
Эта вероятность положительна, когда <tex>k</tex> лежит в промежутке между <tex>\max \{ 0, D+n-N \} </tex> и <tex>\min\{ n,D \}</tex>. | Эта вероятность положительна, когда <tex>k</tex> лежит в промежутке между <tex>\max \{ 0, D+n-N \} </tex> и <tex>\min\{ n,D \}</tex>. |
Текущая версия
Функция вероятности | |
Функция распределения | |
Параметры | |
Носитель | |
Функция вероятности | |
Функция распределения | |
Математическое ожидание | |
Медиана | |
Мода | |
Дисперсия | |
Коэффициент асимметрии | |
Коэффициент эксцесса | |
Информационная энтропия | |
Производящая функция моментов | |
Характеристическая функция |
Гипергеометрическое распределение — это дискретное вероятностное распределение, которое описывает количество успехов в выборке без возвращений длины над конечной совокупностью объектов.
Попали в выборку | Не попали в выборку | Всего | |
---|---|---|---|
С дефектом (успех) | |||
Без дефекта | |||
Всего |
Это выборка из объектов, из которых дефектных. Гипергеометрическое распределение описывает вероятность того, что именно дефектных в выборке из конкретных объектов, взятых из совокупности.
Если случайная величина распределена гипергеометрически с параметрами , тогда вероятность получить ровно успехов (дефектных объектов в предыдущем примере) будет следующей:
- .
Эта вероятность положительна, когда лежит в промежутке между и .
Приведенная формула может трактоваться следующим образом: существует возможных выборок (без возвращения). Есть способов выбрать бракованных объектов и способов заполнить остаток выборки объектами без дефектов.
В случае, когда размер популяции является большим по сравнению с размером выборки (т.е., намного больше, чем ), гипергеометрическое распределение хорошо аппроксимируется биномиальным распределением с параметрами (количество испытаний) и (вероятность успеха в одном испытании).
Симметричность
- ,
- ,
- .
Ссылки
http://en.wikipedia.org/wiki/Hypergeometric_distribution