Гипергеометрическое распределение
Материал из MachineLearning.
(→См. также) |
(в формуле сочетания поменять местами аргументы, плюс в знаменателе верхний аргумент - n) |
||
(2 промежуточные версии не показаны) | |||
Строка 1: | Строка 1: | ||
- | + | {{Вероятностное распределение| | |
+ | name =Гипергеометрическое распределение| | ||
+ | type =Функция| | ||
+ | pdf_image =| | ||
+ | cdf_image =| | ||
+ | parameters =<tex>N\in 0,1,2,3,...\,</tex><br /><tex>D\in 0,1,...,N\,</tex><br /><tex>n\in 0,1,...,N\,</tex><br />| | ||
+ | support =<tex>k \in 0,1,...,n\,</tex>| | ||
+ | pdf =<tex>{{{D \choose k} {{N-D} \choose {n-k}}}\over {N \choose n}}</tex>| | ||
+ | cdf =| | ||
+ | mean =<tex>nD\over N</tex>| | ||
+ | median =| | ||
+ | mode =<tex>\left\lfloor \frac{(D+1)(n+1)}{N+2}\right\rfloor</tex>| | ||
+ | variance =<tex>n(D/N)(1-D/N)(N-n)\over (N-1)</tex>| | ||
+ | skewness =<tex>\frac{(N-2D)(N-1)^\frac{1}{2}(N-2n)}{[nD(N-D)(N-n)]^\frac{1}{2}(N-2)}</tex>| | ||
+ | kurtosis =<tex> \left[\frac{N^2(N-1)}{n(N-2)(N-3)(N-n)}\right]\times</tex><br /><tex>\times \left[\frac{N(N+1)-6N(N-n)}{D(N-D)}+\frac{3n(N-n)(N+6)}{N^2}-6\right]</tex>| | ||
+ | entropy =| | ||
+ | mgf =<tex>\frac{{N-D \choose n}}{{N \choose n}}\,_2F_1(-n,-D;N-D-n+1;e^{t})</tex>| | ||
+ | char =<tex>\frac{{N-D \choose n}}{{N \choose n}}\,_2F_1(-n,-D;N-D-n+1;e^{it})</tex> | ||
+ | }} | ||
- | + | '''Гипергеометрическое распределение''' — это дискретное вероятностное распределение, которое описывает количество успехов в выборке без возвращений длины <tex>n</tex> над конечной совокупностью объектов. | |
{| class="wikitable" | {| class="wikitable" | ||
Строка 26: | Строка 44: | ||
|} | |} | ||
- | Это выборка из <tex>N</tex> объектов | + | Это выборка из <tex>N</tex> объектов, из которых <tex>m</tex> дефектных. Гипергеометрическое распределение описывает вероятность того, что именно <tex>k</tex> дефектных в выборке из <tex>n</tex> конкретных объектов, взятых из совокупности. |
Если случайная величина <tex>X</tex> распределена гипергеометрически с параметрами <tex>N,\;m,\;n</tex>, тогда вероятность получить ровно <tex>k</tex> успехов (дефектных объектов в предыдущем примере) будет следующей: | Если случайная величина <tex>X</tex> распределена гипергеометрически с параметрами <tex>N,\;m,\;n</tex>, тогда вероятность получить ровно <tex>k</tex> успехов (дефектных объектов в предыдущем примере) будет следующей: | ||
- | <tex> | + | ::<tex>f(k;N,m,n)=\frac{C_m^k C_{N-m}^{n-k}}{C_N^n}</tex>. |
- | f(k;N,m,n)=\frac{ | + | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | </tex> | + | |
- | == | + | Эта вероятность положительна, когда <tex>k</tex> лежит в промежутке между <tex>\max \{ 0, D+n-N \} </tex> и <tex>\min\{ n,D \}</tex>. |
- | <tex> | + | |
- | + | Приведенная формула может трактоваться следующим образом: существует <tex> N \choose n </tex> возможных выборок (без возвращения). Есть <tex> D \choose k </tex> способов выбрать <tex>k</tex> бракованных объектов и <tex> {N-D} \choose {n-k} </tex> способов заполнить остаток выборки объектами без дефектов. | |
- | </tex> | + | |
+ | В случае, когда размер популяции является большим по сравнению с размером выборки (т.е., <tex>N</tex> намного больше, чем <tex>n</tex>), гипергеометрическое распределение хорошо аппроксимируется [[Биномиальное распределение|биномиальным распределением]] с параметрами <tex>n</tex> (количество испытаний) и <tex>p = D/N</tex> (вероятность успеха в одном испытании). | ||
+ | |||
+ | == Симметричность == | ||
+ | ::<tex> f(k;N,D,n) = {{{D \choose k} {{N-D} \choose {n-k}}}\over {N \choose n}} = f(n-k;N,N-D,n)</tex>, | ||
+ | ::<tex> f(k;N,D,n) = f(D-k;N,D,N-n)</tex>, | ||
+ | ::<tex> f(k;N,D,n) = f(k;N,n,D) </tex>. | ||
==Ссылки== | ==Ссылки== |
Текущая версия
Функция вероятности | |
Функция распределения | |
Параметры | |
Носитель | |
Функция вероятности | |
Функция распределения | |
Математическое ожидание | |
Медиана | |
Мода | |
Дисперсия | |
Коэффициент асимметрии | |
Коэффициент эксцесса | |
Информационная энтропия | |
Производящая функция моментов | |
Характеристическая функция |
Гипергеометрическое распределение — это дискретное вероятностное распределение, которое описывает количество успехов в выборке без возвращений длины над конечной совокупностью объектов.
Попали в выборку | Не попали в выборку | Всего | |
---|---|---|---|
С дефектом (успех) | |||
Без дефекта | |||
Всего |
Это выборка из объектов, из которых дефектных. Гипергеометрическое распределение описывает вероятность того, что именно дефектных в выборке из конкретных объектов, взятых из совокупности.
Если случайная величина распределена гипергеометрически с параметрами , тогда вероятность получить ровно успехов (дефектных объектов в предыдущем примере) будет следующей:
- .
Эта вероятность положительна, когда лежит в промежутке между и .
Приведенная формула может трактоваться следующим образом: существует возможных выборок (без возвращения). Есть способов выбрать бракованных объектов и способов заполнить остаток выборки объектами без дефектов.
В случае, когда размер популяции является большим по сравнению с размером выборки (т.е., намного больше, чем ), гипергеометрическое распределение хорошо аппроксимируется биномиальным распределением с параметрами (количество испытаний) и (вероятность успеха в одном испытании).
Симметричность
- ,
- ,
- .
Ссылки
http://en.wikipedia.org/wiki/Hypergeometric_distribution