Статистика (функция выборки)
Материал из MachineLearning.
(Новая: {{TOCright}} '''Статистика''' — это измеримая функция выборки. Также статистика — это о...) |
м (уточнение) |
||
Строка 31: | Строка 31: | ||
=== Выборочный центральный момент ''k''-го порядка === | === Выборочный центральный момент ''k''-го порядка === | ||
- | ::<tex>\ | + | ::<tex>\overset{\circ}M^k = \frac1m \sum_{i=1}^m \left( x_i - \bar x \right)^k.</tex> |
Выборочная дисперсия есть центральный момент второго порядка. | Выборочная дисперсия есть центральный момент второго порядка. | ||
- | === Выборочный | + | === Выборочный [[коэффициент асимметрии]] === |
- | ::<tex>\gamma_1 = \ | + | ::<tex>\gamma_1 = \overset{\circ}M^3 / s^3.</tex> |
+ | Несмещённая оценка: | ||
+ | ::<tex>\gamma_1 = \frac{}{}\overset{\circ}M^3 / s^3.</tex> | ||
+ | |||
Если плотность распределения симметрична, то <tex>\gamma_1 = 0</tex>. | Если плотность распределения симметрична, то <tex>\gamma_1 = 0</tex>. | ||
Строка 44: | Строка 47: | ||
Выборочный коэффициент асимметрии часто используется для предварительной [[Критерии нормальности|проверки выборки на нормальность]]. | Выборочный коэффициент асимметрии часто используется для предварительной [[Критерии нормальности|проверки выборки на нормальность]]. | ||
- | === Выборочный | + | === Выборочный [[коэффициент эксцесса]] === |
- | ::<tex>\gamma_2 = \ | + | ::<tex>\gamma_2 = \overset{\circ}M^4 / s^4 - 3.</tex> |
+ | Несмещённая оценка: | ||
[[Нормальное распределение]] имеет нулевой эксцесс, <tex>\gamma_2 = 0</tex>. | [[Нормальное распределение]] имеет нулевой эксцесс, <tex>\gamma_2 = 0</tex>. | ||
Версия 09:53, 6 августа 2008
|
Статистика — это измеримая функция выборки.
Также статистика — это область знаний (и соответствующие ей учебные дисциплины), в которой излагаются общие вопросы сбора, измерения и анализа массовых статистических (количественных или качественных) данных.
Определение
Пусть задана случайная выборка наблюдений .
Статистикой называется произвольная измеримая функция выборки .
Любой статистический критерий основан на вычислении некоторой статистики и затем проверке, попадает ли её значение в область наиболее вероятных значений. Если не попадает, то нулевая гипотеза данного критерия отвергается.
Ниже приводятся примеры наиболее часто используемых статистик. Все они предполагают, что наблюдения являются числовыми, . В последние годы активно развивается также статистика объектов нечисловой природы.
Моменты
Выборочное среднее
Выборочная дисперсия
Несмещённая оценка дисперсии:
Выборочный момент k-го порядка
Выборочное среднее есть момент первого порядка.
Выборочный центральный момент k-го порядка
Выборочная дисперсия есть центральный момент второго порядка.
Выборочный коэффициент асимметрии
Несмещённая оценка:
Если плотность распределения симметрична, то .
Если левый хвост распределения тяжелее, то .
Если правый хвост распределения тяжелее, то .
Выборочный коэффициент асимметрии часто используется для предварительной проверки выборки на нормальность.
Выборочный коэффициент эксцесса
Несмещённая оценка: Нормальное распределение имеет нулевой эксцесс, .
Если пик распределения острее, чем у нормального, то , иначе .
Выборочный коэффициент эксцесса часто используется для предварительной проверки выборки на нормальность.
Порядковые статистики
Порядковые статистики основаны на вычислении вариационного ряда, который получается из исходной выборки путём упорядочивания её элементов по возрастанию:
Значение называется k-й порядковой статистикой.
Выборочная квантиль
Выборочная -квантиль при есть
Размах выборки
Выборочная медиана
Литература
- Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. — М.: Большая российская энциклопедия, 2003. — 912 с.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.