Эмпирическое распределение

Материал из MachineLearning.

Перейти к: навигация, поиск

Эмпирическая функция распределения — естественное приближение теоретической функции распределения данной случайной величины, построенное по выборке.

Содержание

Определения

Пусть задана случайная выборка x^m=\left(x_1,\ldots,x_m\right) наблюдений x_i \in X. Построим по выборке ступенчатую функцию \hat{F}_m(x), возрастающую скачками величины \frac{1}{m} в точках x_{(i)}. Построенная функция называется эмпирической функцией распределения. Для задания значений в точках разрыва формально определим её так:

\hat{F}_m(x)\;=\;\frac{1}{m}\sum_{i=1}^m I_{\left\{x_i\leq x\right\}}.

Замечание: при этом эмпирическая функция непрерывна справа.

На рисунке представлена функция стандартного нормального распределения и эмпирическая функция распределения, построенная по выборке из 10 случайных наблюдений из стандартного нормального закона.

Пример эмпирической функции распределения, построенной по выборке из 10 наблюдений.
Пример эмпирической функции распределения, построенной по выборке из 10 наблюдений.

Свойства эмпирической функции распределения

Эмпирическое распределение для фиксированного x

Поскольку случайная величина I_{\left\{x_i\leq x\right\}} имеет распределение Бернулли с вероятностью успеха F(x) (где F(x) - теоретическая функция распределения случайной величины x), а последовательность \left(I_{\left\{x_1\leq x\right\}},\ldots,I_{\left\{x_m\leq x\right\}}\right) - схема Бернулли с вероятностью успеха F(x), то по отношению к этой последовательности \hat{F}_m(x) есть частота попаданий левее x.

Математическое ожидание и дисперсия эмпирического распределения

Математическое ожидание эмпирической функции распределения

  • E\left[\hat{F}_m(x)\right] = F(x),

таким образом эмпирическое распределение является несмещённой оценкой теоретической функции распределения F(x).

Дисперсия эмпирического распределения

  • D\left[\hat{F}_m(x)\right]=\frac{F(x)\left(1-F(x)\right)}{m}.

Асимптотические свойства эмпирической функции распределения

  1. По усиленному закону больших чисел \hat{F}_m(x) сходится почти наверное к теоретической функции распределения F(x).

Замечания

Личные инструменты