Эмпирическое распределение

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: '''Эмпирическая функция распределения''' — естественное приближение теоретической [[Функция распреде...)
Строка 3: Строка 3:
== Определения ==
== Определения ==
 +
Пусть задана [[Выборка|случайная выборка]] <tex>x^m=\left(x_1,\ldots,x_m\right)</tex> наблюдений <tex>x_i \in X.</tex>
 +
Построим по выборке ступенчатую функцию <tex>\hat{F}_m(x)</tex>, возрастающую скачками величины <tex>\frac{1}{m}</tex> в точках <tex>x_{(i)}.</tex>
 +
Построенная функция называется ''эмпирической функцией распределения''.
 +
Для задания значений в точках разрыва формально определим её так:
 +
::<tex>\hat{F}_m(x)\;=\;\frac{1}{m}\sum_{i=1}^m I_{\left\{x_i\leq x\right\}}.</tex>
 +
 +
'''Замечание:''' при этом эмпирическая функция непрерывна справа.
 +
 +
На рисунке представлена функция стандартного нормального распределения и эмпирическая функция распределения, построенная по выборке из 10 случайных наблюдений из стандартного нормального закона.
 +
 +
[[Изображение:EmpCdf.png|thumb|right|400px|Пример эмпирической функции распределения, построенной по выборке из 10 наблюдений.]]
 +
 +
==Свойства эмпирической функции распределения==
 +
=== Эмпирическое распределение для фиксированного <tex>x</tex> ===
 +
 +
Поскольку случайная величина <tex>I_{\left\{x_i\leq x\right\}}</tex> имеет распределение Бернулли с вероятностью успеха <tex>F(x)</tex> (где <tex>F(x)</tex> - теоретическая
 +
[[Функция распределения|функция распределения]] случайной величины <tex>x</tex>), а последовательность <tex>\left(I_{\left\{x_1\leq x\right\}},\ldots,I_{\left\{x_m\leq x\right\}}\right)</tex> - схема Бернулли с вероятностью успеха <tex>F(x)</tex>, то по отношению к этой последовательности <tex>\hat{F}_m(x)</tex> есть частота попаданий левее x.
 +
 +
===Математическое ожидание и дисперсия эмпирического распределения===
 +
Математическое ожидание эмпирической функции распределения
 +
*<tex>E\left[\hat{F}_m(x)\right] = F(x),</tex>
 +
 +
таким образом эмпирическое распределение является [[Несмещённая оценка|несмещённой оценкой]] теоретической функции распределения <tex>F(x)</tex>.
 +
 +
Дисперсия эмпирического распределения
 +
*<tex>D\left[\hat{F}_m(x)\right]=\frac{F(x)\left(1-F(x)\right)}{m}.</tex>
 +
 +
===Асимптотические свойства эмпирической функции распределения===
 +
 +
# По [[Закон больших чисел|усиленному закону больших чисел]] <tex>\hat{F}_m(x)</tex> сходится ''почти наверное'' к теоретической функции распределения <tex>F(x).</tex>
== Замечания ==
== Замечания ==

Версия 12:23, 6 января 2010

Эмпирическая функция распределения — естественное приближение теоретической функции распределения данной случайной величины, построенное по выборке.

Содержание

Определения

Пусть задана случайная выборка x^m=\left(x_1,\ldots,x_m\right) наблюдений x_i \in X. Построим по выборке ступенчатую функцию \hat{F}_m(x), возрастающую скачками величины \frac{1}{m} в точках x_{(i)}. Построенная функция называется эмпирической функцией распределения. Для задания значений в точках разрыва формально определим её так:

\hat{F}_m(x)\;=\;\frac{1}{m}\sum_{i=1}^m I_{\left\{x_i\leq x\right\}}.

Замечание: при этом эмпирическая функция непрерывна справа.

На рисунке представлена функция стандартного нормального распределения и эмпирическая функция распределения, построенная по выборке из 10 случайных наблюдений из стандартного нормального закона.

Пример эмпирической функции распределения, построенной по выборке из 10 наблюдений.
Пример эмпирической функции распределения, построенной по выборке из 10 наблюдений.

Свойства эмпирической функции распределения

Эмпирическое распределение для фиксированного x

Поскольку случайная величина I_{\left\{x_i\leq x\right\}} имеет распределение Бернулли с вероятностью успеха F(x) (где F(x) - теоретическая функция распределения случайной величины x), а последовательность \left(I_{\left\{x_1\leq x\right\}},\ldots,I_{\left\{x_m\leq x\right\}}\right) - схема Бернулли с вероятностью успеха F(x), то по отношению к этой последовательности \hat{F}_m(x) есть частота попаданий левее x.

Математическое ожидание и дисперсия эмпирического распределения

Математическое ожидание эмпирической функции распределения

  • E\left[\hat{F}_m(x)\right] = F(x),

таким образом эмпирическое распределение является несмещённой оценкой теоретической функции распределения F(x).

Дисперсия эмпирического распределения

  • D\left[\hat{F}_m(x)\right]=\frac{F(x)\left(1-F(x)\right)}{m}.

Асимптотические свойства эмпирической функции распределения

  1. По усиленному закону больших чисел \hat{F}_m(x) сходится почти наверное к теоретической функции распределения F(x).

Замечания

Личные инструменты