Проверка гипотезы наличия тренда для количества посетителей сервиса "Яндекс Кубок"
Материал из MachineLearning.
Строка 1: | Строка 1: | ||
- | Дана статистика числа посетителей сервиса | + | Дана статистика числа посетителей сервиса [http://kubok.yandex.ru|Яндекс Кубок] с марта 2001 года по ноябрь 2008 года. |
Необходимо проверить гипотезу наличия тренда в выборке с доверительной вероятность <tex>\alpha = 0.95</tex>. | Необходимо проверить гипотезу наличия тренда в выборке с доверительной вероятность <tex>\alpha = 0.95</tex>. | ||
Версия 19:07, 11 января 2009
Дана статистика числа посетителей сервиса Кубок с марта 2001 года по ноябрь 2008 года. Необходимо проверить гипотезу наличия тренда в выборке с доверительной вероятность .
График числа посещений изображен ниже, сами данные, вследствие открытого доступа к ним и их размера не представлены.
Здесь пики приходятся на время проведения кубков Яндекса по поиску в интернете, в остальное время число посетителей мало.
Проверим, есть ли здесь тренд.
Так как мы не можем сказать, что распределение нормально и дисперсия постоянна, то критерий Аббе-Линника здесь не применим.
Сначала воспользуемся критерием Фостера-Стюарта.
Статистика критерия для средних имеет вид
- ,
где
- если , то , в противном случае
- если , то , в противном случае
Получилось
При отсутствии тренда величина
- , где
имеет распределение Стьюдента с степенями свободы.
После вычислений получаем: .
-квантиль распределения Стьюдента с степенями свободы
, поэтому гипотеза отсутствия трендов отклоняется.
Теперь воспользуемся критерием Кокса-Стюарта.
Сначала посчитаем статистику :
- , где
Получилось:
Теперь посчитаем нормализованную статистику
- , где
- и
- .
Получилось
При гипотеза тренда среднего отклоняется ( - -квантиль нормального распределения).
, гипотеза тренда принимается.
В заключение, стоит отметить, что критерий Кокса-Стюарта намного более быстрый чем критерий Фостера-Стюарта. Если в критерие Кокса-Стюарта сложность вычислений зависит линейно от объема данных, то в критерие Фостера-Стюарта зависимость квадратичная. Поэтому при больших объемах данных критерий Кокса-Стюарта оказывается более предпочтительным.
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.