Гипергеометрическое распределение

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: ==Гипергеометрическое распределение== ==Применение и примеры== ==Симметрии== ==Родственные распределени...)
Текущая версия (15:16, 24 февраля 2017) (править) (отменить)
(в формуле сочетания поменять местами аргументы, плюс в знаменателе верхний аргумент - n)
 
(8 промежуточных версий не показаны.)
Строка 1: Строка 1:
-
==Гипергеометрическое распределение==
+
{{Вероятностное распределение|
-
==Применение и примеры==
+
name =Гипергеометрическое распределение|
-
==Симметрии==
+
type =Функция|
-
==Родственные распределения==
+
pdf_image =|
-
==Многомерное гипергеометрическое распределение==
+
cdf_image =|
 +
parameters =<tex>N\in 0,1,2,3,...\,</tex><br /><tex>D\in 0,1,...,N\,</tex><br /><tex>n\in 0,1,...,N\,</tex><br />|
 +
support =<tex>k \in 0,1,...,n\,</tex>|
 +
pdf =<tex>{{{D \choose k} {{N-D} \choose {n-k}}}\over {N \choose n}}</tex>|
 +
cdf =|
 +
mean =<tex>nD\over N</tex>|
 +
median =|
 +
mode =<tex>\left\lfloor \frac{(D+1)(n+1)}{N+2}\right\rfloor</tex>|
 +
variance =<tex>n(D/N)(1-D/N)(N-n)\over (N-1)</tex>|
 +
skewness =<tex>\frac{(N-2D)(N-1)^\frac{1}{2}(N-2n)}{[nD(N-D)(N-n)]^\frac{1}{2}(N-2)}</tex>|
 +
kurtosis =<tex> \left[\frac{N^2(N-1)}{n(N-2)(N-3)(N-n)}\right]\times</tex><br /><tex>\times \left[\frac{N(N+1)-6N(N-n)}{D(N-D)}+\frac{3n(N-n)(N+6)}{N^2}-6\right]</tex>|
 +
entropy =|
 +
mgf =<tex>\frac{{N-D \choose n}}{{N \choose n}}\,_2F_1(-n,-D;N-D-n+1;e^{t})</tex>|
 +
char =<tex>\frac{{N-D \choose n}}{{N \choose n}}\,_2F_1(-n,-D;N-D-n+1;e^{it})</tex>
 +
}}
 +
 
 +
'''Гипергеометрическое распределение''' &mdash; это дискретное вероятностное распределение, которое описывает количество успехов в выборке без возвращений длины <tex>n</tex> над конечной совокупностью объектов.
 +
 
 +
{| class="wikitable"
 +
|-
 +
!
 +
! Попали в выборку
 +
! Не попали в выборку
 +
! Всего
 +
|-
 +
! С дефектом (успех)
 +
| <tex>k</tex>
 +
| <tex>m-k</tex>
 +
| <tex>m</tex>
 +
|-
 +
! Без дефекта
 +
| <tex>n-k</tex>
 +
| <tex>N+k-n-m</tex>
 +
| <tex>N-m</tex>
 +
|-
 +
! Всего
 +
| <tex>n</tex>
 +
| <tex>N-n</tex>
 +
| <tex>N</tex>
 +
|}
 +
 
 +
Это выборка из <tex>N</tex> объектов, из которых <tex>m</tex> дефектных. Гипергеометрическое распределение описывает вероятность того, что именно <tex>k</tex> дефектных в выборке из <tex>n</tex> конкретных объектов, взятых из совокупности.
 +
 
 +
Если случайная величина <tex>X</tex> распределена гипергеометрически с параметрами <tex>N,\;m,\;n</tex>, тогда вероятность получить ровно <tex>k</tex> успехов (дефектных объектов в предыдущем примере) будет следующей:
 +
 
 +
::<tex>f(k;N,m,n)=\frac{C_m^k C_{N-m}^{n-k}}{C_N^n}</tex>.
 +
 
 +
Эта вероятность положительна, когда <tex>k</tex> лежит в промежутке между <tex>\max \{ 0, D+n-N \} </tex> и <tex>\min\{ n,D \}</tex>.
 +
 
 +
Приведенная формула может трактоваться следующим образом: существует <tex> N \choose n </tex> возможных выборок (без возвращения). Есть <tex> D \choose k </tex> способов выбрать <tex>k</tex> бракованных объектов и <tex> {N-D} \choose {n-k} </tex> способов заполнить остаток выборки объектами без дефектов.
 +
 
 +
В случае, когда размер популяции является большим по сравнению с размером выборки (т.е., <tex>N</tex> намного больше, чем <tex>n</tex>), гипергеометрическое распределение хорошо аппроксимируется [[Биномиальное распределение|биномиальным распределением]] с параметрами <tex>n</tex> (количество испытаний) и <tex>p = D/N</tex> (вероятность успеха в одном испытании).
 +
 
 +
== Симметричность ==
 +
::<tex> f(k;N,D,n) = {{{D \choose k} {{N-D} \choose {n-k}}}\over {N \choose n}} = f(n-k;N,N-D,n)</tex>,
 +
::<tex> f(k;N,D,n) = f(D-k;N,D,N-n)</tex>,
 +
::<tex> f(k;N,D,n) = f(k;N,n,D) </tex>.
 +
 
 +
==Ссылки==
 +
http://en.wikipedia.org/wiki/Hypergeometric_distribution
 +
 
 +
==См. также==
 +
* [[Выборочный контроль качества]]
 +
* [[Слабая вероятностная аксиоматика]]
 +
 
 +
 
 +
[[Категория:Вероятностные распределения]]

Текущая версия

Гипергеометрическое распределение
Функция вероятности
Функция распределения
Параметры N\in 0,1,2,3,...\,
D\in 0,1,...,N\,
n\in 0,1,...,N\,
Носитель k \in 0,1,...,n\,
Функция вероятности {{{D \choose k} {{N-D} \choose {n-k}}}\over {N \choose n}}
Функция распределения
Математическое ожидание nD\over N
Медиана
Мода \left\lfloor \frac{(D+1)(n+1)}{N+2}\right\rfloor
Дисперсия n(D/N)(1-D/N)(N-n)\over (N-1)
Коэффициент асимметрии \frac{(N-2D)(N-1)^\frac{1}{2}(N-2n)}{[nD(N-D)(N-n)]^\frac{1}{2}(N-2)}
Коэффициент эксцесса  \left[\frac{N^2(N-1)}{n(N-2)(N-3)(N-n)}\right]\times
\times \left[\frac{N(N+1)-6N(N-n)}{D(N-D)}+\frac{3n(N-n)(N+6)}{N^2}-6\right]
Информационная энтропия
Производящая функция моментов \frac{{N-D \choose n}}{{N \choose n}}\,_2F_1(-n,-D;N-D-n+1;e^{t})
Характеристическая функция \frac{{N-D \choose n}}{{N \choose n}}\,_2F_1(-n,-D;N-D-n+1;e^{it})


Гипергеометрическое распределение — это дискретное вероятностное распределение, которое описывает количество успехов в выборке без возвращений длины n над конечной совокупностью объектов.

Попали в выборку Не попали в выборку Всего
С дефектом (успех) k m-k m
Без дефекта n-k N+k-n-m N-m
Всего n N-n N

Это выборка из N объектов, из которых m дефектных. Гипергеометрическое распределение описывает вероятность того, что именно k дефектных в выборке из n конкретных объектов, взятых из совокупности.

Если случайная величина X распределена гипергеометрически с параметрами N,\;m,\;n, тогда вероятность получить ровно k успехов (дефектных объектов в предыдущем примере) будет следующей:

f(k;N,m,n)=\frac{C_m^k C_{N-m}^{n-k}}{C_N^n}.

Эта вероятность положительна, когда k лежит в промежутке между \max \{ 0, D+n-N \} и \min\{ n,D \}.

Приведенная формула может трактоваться следующим образом: существует  N \choose n возможных выборок (без возвращения). Есть  D \choose k способов выбрать k бракованных объектов и  {N-D} \choose {n-k} способов заполнить остаток выборки объектами без дефектов.

В случае, когда размер популяции является большим по сравнению с размером выборки (т.е., N намного больше, чем n), гипергеометрическое распределение хорошо аппроксимируется биномиальным распределением с параметрами n (количество испытаний) и p = D/N (вероятность успеха в одном испытании).

Симметричность

 f(k;N,D,n) = {{{D \choose k} {{N-D} \choose {n-k}}}\over {N \choose n}} = f(n-k;N,N-D,n),
 f(k;N,D,n) = f(D-k;N,D,N-n),
 f(k;N,D,n) = f(k;N,n,D) .

Ссылки

http://en.wikipedia.org/wiki/Hypergeometric_distribution

См. также