Статистика (функция выборки)
Материал из MachineLearning.
(дополнение, оформление) |
|||
Строка 62: | Строка 62: | ||
Выборочный коэффициент эксцесса часто используется для грубой предварительной [[Критерии нормальности|проверки на нормальность]]. | Выборочный коэффициент эксцесса часто используется для грубой предварительной [[Критерии нормальности|проверки на нормальность]]. | ||
Он позволяет отвергнуть, но не позволяет принять гипотезу нормальности. | Он позволяет отвергнуть, но не позволяет принять гипотезу нормальности. | ||
+ | |||
+ | == Статистики, связанные с эмпирическим распределением == | ||
+ | [[Эмпирическое распределение]] случайной величины <tex>x</tex>, построенное по случайной выборке <tex>x^m</tex>, есть функция | ||
+ | :<tex>\displaystyle F_m(x) = \frac1m \sum_{i=1}^m \left[ x_i<x \right].</tex> | ||
+ | При любом фиксированном <tex>a\in\mathbb{R}</tex> значение <tex>F_m(a)</tex> можно рассматривать как статистику. | ||
== Порядковые статистики == | == Порядковые статистики == | ||
Строка 82: | Строка 87: | ||
::<tex>\mu = \begin{cases} \frac12 \left(x^{(k)}+x^{(k+1)}\right),& m=2k;\\ x^{(k+1)},& m=2k+1.\end{cases}</tex> | ::<tex>\mu = \begin{cases} \frac12 \left(x^{(k)}+x^{(k+1)}\right),& m=2k;\\ x^{(k+1)},& m=2k+1.\end{cases}</tex> | ||
- | == | + | == Ранговые статистики == |
- | + | {{UnderConstruction|Этот раздел скоро будет дописан}} | |
- | + | ||
- | + | ||
== Литература == | == Литература == | ||
Строка 98: | Строка 101: | ||
[[Категория:Математическая статистика]] | [[Категория:Математическая статистика]] | ||
[[Категория:Прикладная статистика]] | [[Категория:Прикладная статистика]] | ||
+ | [[Категория:Популярные и обзорные статьи]] |
Версия 18:19, 7 августа 2008
|
Статистика — это измеримая функция выборки.
Также статистика — это область знаний (и соответствующие ей учебные дисциплины), в которой излагаются общие вопросы сбора, измерения и анализа массовых статистических (количественных или качественных) данных.
Определение
Пусть задана случайная выборка наблюдений .
Статистикой называется произвольная измеримая функция выборки .
Любой статистический критерий основан на вычислении некоторой статистики и затем проверке, попадает ли её значение в область наиболее вероятных значений. Если не попадает, то нулевая гипотеза данного критерия отвергается.
Примеры наиболее часто используемых статистик приводятся ниже. Все они предполагают, что наблюдения являются числовыми, . В последние годы активно развивается также статистика объектов нечисловой природы.
Моменты
Выборочное среднее
Выборочная дисперсия
Несмещённая оценка дисперсии:
Выборочный момент k-го порядка
Выборочное среднее есть момент первого порядка.
Выборочный центральный момент k-го порядка
Выборочная дисперсия есть центральный момент второго порядка.
Несмещённые оценки центральных моментов:
Выборочный коэффициент асимметрии
Если плотность распределения симметрична, то .
Если левый хвост распределения тяжелее, то .
Если правый хвост распределения тяжелее, то .
Выборочный коэффициент асимметрии используется для проверки распределения на симметричность, а также для грубой предварительной проверки на нормальность. Он позволяет отвергнуть, но не позволяет принять гипотезу нормальности.
Выборочный коэффициент эксцесса
Нормальное распределение имеет нулевой эксцесс, .
Если хвосты распределения «легче», а пик острее, чем у нормального распределения, то .
Если хвосты распределения «тяжелее», а пик более «приплюснутый», чем у нормального распределения, то .
Выборочный коэффициент эксцесса часто используется для грубой предварительной проверки на нормальность. Он позволяет отвергнуть, но не позволяет принять гипотезу нормальности.
Статистики, связанные с эмпирическим распределением
Эмпирическое распределение случайной величины , построенное по случайной выборке , есть функция
При любом фиксированном значение можно рассматривать как статистику.
Порядковые статистики
Порядковые статистики основаны на вычислении вариационного ряда, который получается из исходной выборки путём упорядочивания её элементов по возрастанию:
Значение называется k-й порядковой статистикой.
Выборочная квантиль
Выборочная -квантиль при есть
Размах выборки
Выборочная медиана
Ранговые статистики
Статья в настоящий момент дорабатывается. Этот раздел скоро будет дописан |
Литература
- Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. — М.: Большая российская энциклопедия, 2003. — 912 с.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
Ссылки
- Википедия:Статистика.
- Skewness — коэффициент асимметрии.
- Kurtosis — коэффициент эксцесса.