Ранговые критерии

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: '''Ранговые критерии''' — это статистические тесты, в которых вместо выборочных значений используются ...)
(опечатка)

Версия 19:37, 5 января 2010

Ранговые критерии — это статистические тесты, в которых вместо выборочных значений используются их ранги(номера элементов в упорядоченной по возрастанию выборке). Большинство ранговых критериев являются непараметрическими, хотя среди ранговых критериев встречаются и параметрические, например, одновыборочный критерий Колмогорова-Смирнова.[1]

Содержание

Классификация ранговых критериев

Ранговые критерии можно разбить на группы в зависимости от типа статистической гипотезы, которую они проверяют. Некоторые критерии входят в несколько групп, так как их можно использовать для проверки различных гипотез. [1]

Критерии случайности

Пусть задана выборка x_1, \dots x_n. Проверяется гипотеза о том, что наблюдения x_i независимы и подчиняются одному и тому же распределению с плотностью f(x).

Критерии симметрии

Пусть задана простая выборка  x_1, \dots, x_n c плотностью f(x) Проверяется гипотеза о том, что плотность распределения симметрична относительно своего центра a.

Возможная формулировка нулевой гипотезы: H_0: f(a + x) = f(a-x) .

Критерии корреляции

Задана выборка пар наблюдений (x_i, y_i) объёма n Проверяется гипотеза о наличии корреляции между случайными величинами x и y. Для проверки этой гипотезы используются критерии, основанные на различных коэффициентах ранговой корреляции.

Обобщением ранговой корреляции на случай нескольких выборок является коэффициент конкордации. На её основе строятся тесты для анализа корреляции нескольких выборок.

Критерии сдвига и масштаба

Критерии сдвига

Проверяется гипотеза сдвига, согласно которой распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу. Пусть заданы две выборки x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R},взятые из неизвестных непрерывных распределений F(x) и G(y) соответственно.

Нулевая гипотеза — H_0: \quad F(x) = G(y - \mu)

Наиболее частая альтернативная гипотеза - H_1: \quad F(x) \ne G(y - \mu).

Кроме критериев, проверяющих гипотезу сдвига для двух совокупностей, существует большое количество тестов для проверки гипотезы сдвига среди нескольких совокупностей. Далее приведены некоторые из них:

Критерии масштаба Для двух выборок x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}. проверяется гипотеза о том, что они принадлежат одному и тому же распределению, но с разным параметром масштаба. Если плотность распределения первой выборки — f(x), а второй выборки — \frac{1}{\tau}f( \frac{x}{\tau}), то нулевая гипотеза H_0: \tau \ne 1.

Примечания

Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
  2. Hajek J., Sidak Z., Sen K. P. Theory of rank tests(second edition). — Academic Press, 1999. - 450 p.

См. также

Ссылки

Rank correlation


Данная статья является непроверенным учебным заданием.
Студент: Участник:Slimper
Преподаватель: Участник:Vokov
Срок: 08 января 2010

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.


Личные инструменты