Эмпирическое распределение
Материал из MachineLearning.
(Новая: '''Эмпирическая функция распределения''' — естественное приближение теоретической [[Функция распреде...) |
|||
(3 промежуточные версии не показаны) | |||
Строка 1: | Строка 1: | ||
- | '''Эмпирическая функция распределения''' — естественное приближение теоретической [[Функция распределения|функции распределения]] данной [[Случайная величина|случайной величины]], построенное по выборке. | + | '''Эмпирическая функция распределения''' (выборочная функция распределения) — естественное приближение теоретической [[Функция распределения|функции распределения]] данной [[Случайная величина|случайной величины]], построенное по выборке. |
== Определения == | == Определения == | ||
+ | Пусть задана [[Выборка|случайная выборка]] <tex>x^m=\left(x_1,\ldots,x_m\right)</tex> наблюдений <tex>x_i \in X.</tex> | ||
+ | Построим по выборке ступенчатую функцию <tex>\hat{F}_m(x)</tex>, возрастающую скачками величины <tex>\frac{1}{m}</tex> в точках <tex>x_{(i)}.</tex> | ||
+ | Построенная функция называется ''эмпирической функцией распределения''. | ||
+ | Для задания значений в точках разрыва формально определим её так: | ||
- | == | + | ::<tex>\hat{F}_m(x)\;=\;\frac{1}{m}\sum_{i=1}^m I_{\left\{x_i\leq x\right\}}.</tex> |
+ | |||
+ | '''Замечание:''' при этом эмпирическая функция непрерывна справа. | ||
+ | |||
+ | На рисунке представлена функция стандартного нормального распределения и эмпирическая функция распределения, построенная по выборке из 10 случайных наблюдений из стандартного нормального закона. | ||
+ | |||
+ | [[Изображение:EmpCdf.png|thumb|right|400px|Пример эмпирической функции распределения, построенной по выборке из 10 наблюдений.]] | ||
+ | |||
+ | ==Свойства эмпирической функции распределения== | ||
+ | === Эмпирическое распределение для фиксированного <tex>x</tex> === | ||
+ | |||
+ | Поскольку случайная величина <tex>I_{\left\{x_i\leq x\right\}}</tex> имеет распределение Бернулли с вероятностью успеха <tex>F(x)</tex> (где <tex>F(x)</tex> - теоретическая | ||
+ | [[Функция распределения|функция распределения]] случайной величины <tex>x</tex>), а последовательность <tex>\left(I_{\left\{x_1\leq x\right\}},\ldots,I_{\left\{x_m\leq x\right\}}\right)</tex> - схема Бернулли с вероятностью успеха <tex>F(x)</tex>, то по отношению к этой последовательности <tex>\hat{F}_m(x)</tex> есть частота попаданий левее x. | ||
+ | |||
+ | Из сказанного вытекает, что эмпирическое распределение служит естественным приближением к теоретической функции распределения. | ||
+ | ===Математическое ожидание и дисперсия эмпирического распределения=== | ||
+ | Математическое ожидание эмпирической функции распределения | ||
+ | *<tex>E\left[\hat{F}_m(x)\right] = F(x),</tex> | ||
+ | |||
+ | таким образом эмпирическое распределение является [[Несмещённая оценка|несмещённой оценкой]] теоретической функции распределения <tex>F(x)</tex>. | ||
+ | |||
+ | Дисперсия эмпирического распределения | ||
+ | *<tex>D\left[\hat{F}_m(x)\right]=\frac{F(x)\left(1-F(x)\right)}{m}.</tex> | ||
+ | |||
+ | ===Асимптотические свойства эмпирической функции распределения=== | ||
+ | |||
+ | 1. По [[Закон больших чисел|усиленному закону больших чисел]] <tex>\hat{F}_m(x)</tex> сходится ''почти наверное'' к теоретической функции распределения <tex>F(x)</tex>: | ||
+ | ::<tex>\hat{F}_m(x)\to F(x)</tex> ''почти наверное'' при <tex>m \rightarrow \infty.</tex> | ||
+ | 2. Выборочная функция распределения является ''асимптотически нормальной'' оценкой функции распределения <tex>F(x)</tex> при условии, что <tex>0< F(x)< 1,~ \forall x \in \mathbb{R}</tex>: | ||
+ | ::<tex>\sqrt{n}\left(\hat{F}_m(x)-F(x)\right) \to^{P} N\left(0,F(x)(1-F(X))\right)</tex> при <tex>m \to \infty.</tex> | ||
+ | |||
+ | == Литература == | ||
+ | |||
+ | # {{книга | ||
+ | |автор = Лагутин М.Б. | ||
+ | |заглавие = Наглядная математическая статистика. | ||
+ | |издательство = М.: Бином. Лаборатория знаний. | ||
+ | |год = 2009 | ||
+ | |страниц = 472 | ||
+ | }} | ||
+ | # {{книга | ||
+ | |автор = Крамер Г. | ||
+ | |заглавие = Математические методы статистики. | ||
+ | |издательство = М.: Мир. | ||
+ | |год = 1975 | ||
+ | |страниц = 648 | ||
+ | }} | ||
+ | |||
+ | ==Ссылки== | ||
+ | *[http://ru.wikipedia.org/wiki/%D0%92%D1%8B%D0%B1%D0%BE%D1%80%D0%BE%D1%87%D0%BD%D0%B0%D1%8F_%D1%84%D1%83%D0%BD%D0%BA%D1%86%D0%B8%D1%8F_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D1%8F Выборочеая функция распределения] (Википедия) | ||
+ | *[http://en.wikipedia.org/wiki/Convergence_of_random_variables Виды сходимостей случайных величин] (Wikipedia) | ||
+ | [[Категория:Прикладная статистика]] | ||
+ | [[Категория:Математическая статистика]] | ||
+ | [[Категория:Энциклопедия анализа данных]] |
Текущая версия
Эмпирическая функция распределения (выборочная функция распределения) — естественное приближение теоретической функции распределения данной случайной величины, построенное по выборке.
Содержание |
Определения
Пусть задана случайная выборка наблюдений Построим по выборке ступенчатую функцию , возрастающую скачками величины в точках Построенная функция называется эмпирической функцией распределения. Для задания значений в точках разрыва формально определим её так:
Замечание: при этом эмпирическая функция непрерывна справа.
На рисунке представлена функция стандартного нормального распределения и эмпирическая функция распределения, построенная по выборке из 10 случайных наблюдений из стандартного нормального закона.
Свойства эмпирической функции распределения
Эмпирическое распределение для фиксированного
Поскольку случайная величина имеет распределение Бернулли с вероятностью успеха (где - теоретическая функция распределения случайной величины ), а последовательность - схема Бернулли с вероятностью успеха , то по отношению к этой последовательности есть частота попаданий левее x.
Из сказанного вытекает, что эмпирическое распределение служит естественным приближением к теоретической функции распределения.
Математическое ожидание и дисперсия эмпирического распределения
Математическое ожидание эмпирической функции распределения
таким образом эмпирическое распределение является несмещённой оценкой теоретической функции распределения .
Дисперсия эмпирического распределения
Асимптотические свойства эмпирической функции распределения
1. По усиленному закону больших чисел сходится почти наверное к теоретической функции распределения :
- почти наверное при
2. Выборочная функция распределения является асимптотически нормальной оценкой функции распределения при условии, что :
- при
Литература
- Лагутин М.Б. Наглядная математическая статистика.. — М.: Бином. Лаборатория знаний., 2009. — 472 с.
- Крамер Г. Математические методы статистики.. — М.: Мир., 1975. — 648 с.
Ссылки
- Выборочеая функция распределения (Википедия)
- Виды сходимостей случайных величин (Wikipedia)