Участник:Lr2k/Песочница

Материал из MachineLearning.

< Участник:Lr2k(Различия между версиями)

Текущая версия

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Lr2k/%D0%9F%D0%B5%D1%81%D0%BE%D1%87%D0%BD%D0%B8%D1%86%D0%B0»

@@ Строка 1: / Строка 1: @@
-{{TOCright}}
-Однофакторная модель в рамках [[Дисперсионный анализ|дисперсионного анализа]] используется для исследования влияния одной переменной (фактора) на одну зависимую количественную переменную ([[регрессионный анализ|отклик]]).
-Данные состоят из нескольких рядов наблюдений (обработок), которые рассматриваются как реализации независимых между собой выборок. Исходная гипотеза <tex>H_0</tex> говорит об отсутствии различия в обработках, т.е. предполагается, что все наблюдения можно считать одной выборкой из общей совокупности.
-В отличие от [[Однофакторная параметрическая модель| однофакторной параметрической модели]] для непараметрических методов не делается никаких предположений о нормальности выборок. Это существенно расширяет круг рассматриваемых задач.
-== Критерий Краскела-Уоллиса ==
-В качестве [[Непараметрические статистические тесты|непараметрического теста]] для выявления наличия статистически значимых различий между средними нескольких выборок используется [[Критерий Краскела-Уоллиса|критерий Краскела-Уоллиса]]. Он используется для сравнения трех или более выборок, и проверяет нулевые гипотезы, согласно которым различные выборки были взяты из одного и того же распределения, или из распределений с одинаковыми медианами. Таким образом, интерпретация критерия Краскела-Уоллиса  сходна с [[Однофакторная параметрическая модель|параметрическим одномерным дисперсионным анализом]], за исключением того, что этот критерий основан на рангах, а на средних.
-Пусть заданы <i>k</i> выборок: <tex>x_1^{n_1}=\left\{x_{11},\dots,x_{1n_1}\right\}, \dots, x_k^{n_k}=\left\{x_{k1},\dots,x_{kn_k}\right\}</tex>.
-Объединённая выборка: <tex>x=x_1^{n_1}\cup x_2^{n_2}\cup \dots \cup x_k^{n_k}</tex>.
-=== Дополнительные предположения ===
-* обе выборки [[Простая выборка|простые]], объединённая выборка [[Независимая выборка|независима]];
-* выборки взяты из неизвестных непрерывных распределений  <tex>F_1(x),\dots,F_k(x)</tex>.
-=== Нулевая гипотеза ===
-<tex>H_0:\; F_1(x)=\dots=F_k(x)</tex> при альтернативе <tex>H_1:\; F_1(x)=F_2(x-\Delta_1)=\dots=F_k(x-\Delta_{k-1})</tex>.
-=== Примеры задач ===
-'''Пример 1:''' Проходит чемпионат мира по футболу. Первая выборка — опрос болельщиков с вопросом "Каковы шансы на победу сборной России?" до начала чемпионата. Вторая выборка — после первой игры, третья —- после второго матча и т.д. Значения в выборках — шансы России на победу по десятибальной шкале (1 — никаких перспектив, 10 — отвезти в Россию кубок — дело времени). Требуется проверить, зависят ли результаты опросов от хода чемпионата.
-'''Пример 2:''' Есть 3 различных магазина, принадлежащих одной фирме и расположенных в разных точках города, и подневная история объемов продаж в этих магазинах. Необходимо выяснить, есть ли различие в количестве покупок, совершаемых ежедневно в этих магазинах.
-== Критерий Джонкхиера ==
-[[Критерий Джонкхиера]] основан на попарных статистиках [[Критерий Уилкоксона-Манна-Уитни|Уилкоксона-Манна-Уитни]] и используется для проверки [[гипотеза сдвига|гипотезы сдвига]] против альтернатив упорядоченности.
-=== Нулевая гипотеза ===
-[[Гипотеза сдвига]]
-=== Примеры задач ===
-'''Пример 1:''' Имеется гипотеза, что по мере перехода на старшие курсы падает посещаемость лекций. Для выяснения, верно ли это предположение, декан организовал выборочный контроль студентов. Случайным образом были отобраны по пять студентов с каждого курса и организован учёт числа посещённых ими лекций из 30, отобранных случайно на каждом курсе.
-'''Пример 2:''' Утки-пеганки изучались в 20-ти ареалах обитания в устье реки Северн, Великобритания. Целью исследования было выяснить, зависит ли "чистота" окраса (его равномерность и выраженность границ) от того района, где питались птицы. "Чистота" была измерена от 1-го до 8-и, то есть от худшего до лучшего, качество всех районов было ранжировано как "плохой", "средний" и "хороший".
-==Литература==
-# ''Шеффе Г.'' Дисперсионный анализ. — М., 1980.
-# ''Аренс Х.'' ''Лёйтер Ю.'' Многомерный дисперсионный анализ.
-# ''Лапач С. Н. , Чубенко А. В., Бабич П. Н.'' Статистика в науке и бизнесе. — Киев: Морион, 2002.
-# ''Лагутин М. Б.'' Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003.
-# ''Холлендер М., Вульф Д.А.'' Непараметрические методы статистики.
-== Ссылки ==
-* [http://www.tspu.tula.ru/res/math/mop/lections/lection_7.htm#_Toc73845987 Дисперсионный анализ для связанных выборок] - Аналитическая статистика.
-* [http://khomich.narod.ru/metodichka/Dispersionniy/Dispersionniy.htm Дисперсионный анализ].
-* [http://www.ievbran.ru/Kiril/Library/Book1/content354/content354.htm Непараметрические критерии для оценки однородности выборок]
-* [http://www.technion.ac.il/docs/sas/stat/chap28/sect25.htm Jonckheere-Terpstra Test].
-==См. также==
-* [[Однофакторная параметрическая модель]]
-* [[Двухфакторная непараметрическая модель]]
-* [[Дисперсионный анализ]]
-[[Категория:Прикладная статистика]]
-[[Категория:Дисперсионный анализ]]
-{{Задание|Lr2k|Vokov|31 декабря 2009}}

Участник:Lr2k/Песочница

Материал из MachineLearning.

Текущая версия

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты