Участник:Lr2k/Песочница

Материал из MachineLearning.

< Участник:Lr2k(Различия между версиями)
Перейти к: навигация, поиск
Текущая версия (09:31, 30 декабря 2009) (править) (отменить)
(Полностью удалено содержимое страницы)
 
Строка 1: Строка 1:
-
{{TOCright}}
 
-
Однофакторная модель в рамках [[Дисперсионный анализ|дисперсионного анализа]] используется для исследования влияния одной переменной (фактора) на одну зависимую количественную переменную ([[регрессионный анализ|отклик]]).
 
-
 
-
Данные состоят из нескольких рядов наблюдений (обработок), которые рассматриваются как реализации независимых между собой выборок. Исходная гипотеза <tex>H_0</tex> говорит об отсутствии различия в обработках, т.е. предполагается, что все наблюдения можно считать одной выборкой из общей совокупности.
 
-
 
-
В отличие от [[Однофакторная параметрическая модель| однофакторной параметрической модели]] для непараметрических методов не делается никаких предположений о нормальности выборок. Это существенно расширяет круг рассматриваемых задач.
 
-
 
-
== Критерий Краскела-Уоллиса ==
 
-
В качестве [[Непараметрические статистические тесты|непараметрического теста]] для выявления наличия статистически значимых различий между средними нескольких выборок используется [[Критерий Краскела-Уоллиса|критерий Краскела-Уоллиса]]. Он используется для сравнения трех или более выборок, и проверяет нулевые гипотезы, согласно которым различные выборки были взяты из одного и того же распределения, или из распределений с одинаковыми медианами. Таким образом, интерпретация критерия Краскела-Уоллиса сходна с [[Однофакторная параметрическая модель|параметрическим одномерным дисперсионным анализом]], за исключением того, что этот критерий основан на рангах, а на средних.
 
-
 
-
Пусть заданы <i>k</i> выборок: <tex>x_1^{n_1}=\left\{x_{11},\dots,x_{1n_1}\right\}, \dots, x_k^{n_k}=\left\{x_{k1},\dots,x_{kn_k}\right\}</tex>.
 
-
Объединённая выборка: <tex>x=x_1^{n_1}\cup x_2^{n_2}\cup \dots \cup x_k^{n_k}</tex>.
 
-
 
-
=== Дополнительные предположения ===
 
-
* обе выборки [[Простая выборка|простые]], объединённая выборка [[Независимая выборка|независима]];
 
-
* выборки взяты из неизвестных непрерывных распределений <tex>F_1(x),\dots,F_k(x)</tex>.
 
-
 
-
=== Нулевая гипотеза ===
 
-
 
-
<tex>H_0:\; F_1(x)=\dots=F_k(x)</tex> при альтернативе <tex>H_1:\; F_1(x)=F_2(x-\Delta_1)=\dots=F_k(x-\Delta_{k-1})</tex>.
 
-
 
-
=== Примеры задач ===
 
-
'''Пример 1:''' Проходит чемпионат мира по футболу. Первая выборка — опрос болельщиков с вопросом "Каковы шансы на победу сборной России?" до начала чемпионата. Вторая выборка — после первой игры, третья —- после второго матча и т.д. Значения в выборках — шансы России на победу по десятибальной шкале (1 — никаких перспектив, 10 — отвезти в Россию кубок — дело времени). Требуется проверить, зависят ли результаты опросов от хода чемпионата.
 
-
 
-
'''Пример 2:''' Есть 3 различных магазина, принадлежащих одной фирме и расположенных в разных точках города, и подневная история объемов продаж в этих магазинах. Необходимо выяснить, есть ли различие в количестве покупок, совершаемых ежедневно в этих магазинах.
 
-
 
-
== Критерий Джонкхиера ==
 
-
[[Критерий Джонкхиера]] основан на попарных статистиках [[Критерий Уилкоксона-Манна-Уитни|Уилкоксона-Манна-Уитни]] и используется для проверки [[гипотеза сдвига|гипотезы сдвига]] против альтернатив упорядоченности.
 
-
 
-
=== Нулевая гипотеза ===
 
-
 
-
[[Гипотеза сдвига]]
 
-
 
-
=== Примеры задач ===
 
-
'''Пример 1:''' Имеется гипотеза, что по мере перехода на старшие курсы падает посещаемость лекций. Для выяснения, верно ли это предположение, декан организовал выборочный контроль студентов. Случайным образом были отобраны по пять студентов с каждого курса и организован учёт числа посещённых ими лекций из 30, отобранных случайно на каждом курсе.
 
-
 
-
'''Пример 2:''' Утки-пеганки изучались в 20-ти ареалах обитания в устье реки Северн, Великобритания. Целью исследования было выяснить, зависит ли "чистота" окраса (его равномерность и выраженность границ) от того района, где питались птицы. "Чистота" была измерена от 1-го до 8-и, то есть от худшего до лучшего, качество всех районов было ранжировано как "плохой", "средний" и "хороший".
 
-
==Литература==
 
-
 
-
# ''Шеффе Г.'' Дисперсионный анализ. — М., 1980.
 
-
# ''Аренс Х.'' ''Лёйтер Ю.'' Многомерный дисперсионный анализ.
 
-
# ''Лапач С. Н. , Чубенко А. В., Бабич П. Н.'' Статистика в науке и бизнесе. — Киев: Морион, 2002.
 
-
# ''Лагутин М. Б.'' Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003.
 
-
# ''Холлендер М., Вульф Д.А.'' Непараметрические методы статистики.
 
-
 
-
== Ссылки ==
 
-
 
-
* [http://www.tspu.tula.ru/res/math/mop/lections/lection_7.htm#_Toc73845987 Дисперсионный анализ для связанных выборок] - Аналитическая статистика.
 
-
* [http://khomich.narod.ru/metodichka/Dispersionniy/Dispersionniy.htm Дисперсионный анализ].
 
-
* [http://www.ievbran.ru/Kiril/Library/Book1/content354/content354.htm Непараметрические критерии для оценки однородности выборок]
 
-
* [http://www.technion.ac.il/docs/sas/stat/chap28/sect25.htm Jonckheere-Terpstra Test].
 
-
 
-
==См. также==
 
-
 
-
* [[Однофакторная параметрическая модель]]
 
-
* [[Двухфакторная непараметрическая модель]]
 
-
* [[Дисперсионный анализ]]
 
-
 
-
[[Категория:Прикладная статистика]]
 
-
[[Категория:Дисперсионный анализ]]
 
-
 
-
{{Задание|Lr2k|Vokov|31 декабря 2009}}
 

Текущая версия

Личные инструменты