Участник:Пасконова Ольга/Песочница

Материал из MachineLearning.

< Участник:Пасконова Ольга(Различия между версиями)
Перейти к: навигация, поиск
(История)
Текущая версия (11:10, 16 декабря 2009) (править) (отменить)
(История)
 
(70 промежуточных версий не показаны.)
Строка 1: Строка 1:
-
====Статьи о группах методов или критериев====
+
== Двухфакторная непараметрическая модель ==
-
{{well|'''Некоторые рекомендации'''
+
-
# Эти статьи не содержат описаний методов, но в них должны перечисляться ссылки на большое число методов или критериев, объединённых под данным общим названием.
+
* [[Двухфакторная непараметрическая модель]]: [[критерий Фридмана]] [Лапач, 203], [[критерий Пейджа]]. Примеры: сравнение эффективности методов производства, агротехнических приёмов.
-
# Должно даваться общее определение из классических источников (например, из энциклопедии теории вероятностей и математической статистики).
+
-
# Желательны примеры задач.
+
-
# Желательно указывать, чем отличаются различные критерии и методы в данной группе друг от друга, какие есть рекомендации по выбору одного из этих методов.
+
-
# Любые сообщаемые факты должны сопровождаться ссылками на источник.
+
-
# Помните, что предоставляемая информация должна быть полезна специалистам при решении практических задач.
+
-
# Собрать грамотную подборку ссылок (вместо тупого копирования их содержимого) с вашими лаконичными комментариями — это уже очень полезно!
+
-
—&nbsp;''[[Участник:Vokov|К.В.Воронцов]] 02:14, 14 ноября 2009 (MSK)''
+
'''Данные.'''
-
}}
+
 +
В каждом из <tex>n</tex> блоков содержится по одному наблюдению <tex>x_{ij}</tex>
 +
на каждуб из <tex>k</tex> обработок. Будем считать наблюдения реализацией случайных велечин
 +
<tex>X_{ij}</tex> в модели
-
Ссылки на источники обязательны. Если Вы упоминаете другие понятия прикладной статистики (в том числе названия статистических критериев), оформляйте их как ссылки на страницы внутри Ресурса. В конце каждой статьи не забывайте про разделы ==Литература== (для книг), ==Ссылки== (для ссылок на внешние URL), ==См. также== (для ссылок на страницы внутри Ресурса).
+
<tex>X_{ij} = \mu + \alpha_i + \beta_j + \epsilon_{ij}</tex>,
 +
где <tex>1 \le i \le n, 1 \le j \le k, </tex>.
-
==Двухфакторная непараметрическая модель.==
+
Здесь <tex>\mu</tex> - неизвестное общее среднее,
-
новая статья
+
<tex>\alpha_i</tex> - эффект блока <tex>i</tex> (неизвестный мешающий параметр),
 +
<tex>\beta_j</tex> - эффект блока <tex>j</tex> (интересующий нас параметр),
 +
<tex>\epsilon_{ij}</tex> - случайная ошибка
 +
<tex>j</tex>
-
* [[Двухфакторная непараметрическая модель]]: [[критерий Фридмана]] [Лапач, 203], [[критерий Пейджа]]. Примеры: сравнение эффективности методов производства, агротехнических приёмов.
+
'''Допущения.'''
-
==Литература==
+
'''1.''' Все ошибки <tex>\epsilon_{ij}</tex> независимы.
-
(для книг)
+
-
==Ссылки==
+
'''2.''' Все <tex>\epsilon_{ij}</tex> имеют одинаковое непрерывное (неизвестное) распределение.
-
(для ссылок на внешние URL)
+
-
==См. также==
+
==Критерий Фридмана==
-
(для ссылок на страницы внутри Ресурса).
+
-
[[Категория:Прикладная статистика]]
+
Для проверки гипотезы
-
[[Категория:Дисперсионный анализ]]
+
-
==Дисперсионный анализ==
+
<tex> H_0: \beta_1 = \dots = \beta_k </tex>
-
общие определения, примеры задач и перечень методов (в виде списка ссылок)
+
-
{{TOCright}}
+
против альтернативы
-
'''Дисперсионный анализ''' (от латинского Dispersio – рассеивание / Analysis Of Variance - ANOVA) применяется для исследования влияния одной или нескольких качественных переменных (факторов) на одну зависимую количественную переменную ([[регрессионный анализ|отклик]]).
+
<tex> H_1 </tex>: не все <tex> \beta_j </tex> равны между собой
-
В основе дисперсионного анализа лежит предположение о том, что одни переменные могут рассматриваться как причины (факторы, независимые переменные): <tex>f_1,...,f_k</tex>, а другие как следствия (зависимые переменные). Независимые переменные называют иногда регулируемыми факторами именно потому, что в эксперименте исследователь имеет возможность варьировать ими и анализировать получающийся результат.
+
применяется [[Критерий Фридмана]] [Холлендер М., Вульф Д.А., 155; Лагутин М. Б., 260]
-
Сущность дисперсионного анализа заключается в расчленении общей дисперсии изучаемого признака на отдельные компо­ненты, обусловленные влиянием конкретных факторов, и проверке гипотез о значимости влияния этих факторов на исследуемый признак. Сравнивая компоненты дисперсии друг с другом посредством F — критерия Фишера, можно определить, какая доля общей вариативности результативного признака обусловлена действием регулируемых факторов.
+
===Пример===
 +
Д. Хебб и К.Уильямс разработали тест эстакадного лабиринта для сравнительной оценки "сообразительности" животных. Он состоит из 12 заданий. Есть данные средних чисел ошибок при выполнении этих заданий крысами, кроликами и кошками. Есть ли животные, которые значимо различаются?
-
Исходным материалом для дисперсионного анализа служат данные исследования трех и более выборок: tex>x_1,...,x_n</tex>, которые могут быть как равными, так и неравными по численности, как связными, так и несвязными. По количеству выявляемых регулируемых факторов дисперсионный анализ может быть '''однофакторным''' (при этом изучается влияние одного фактора на результаты эксперимента), '''двухфакторным''' (при изучении влияния двух факторов) и '''многофакторным''' (позволяет оценить не только влияние каждого из факторов в отдельности, но и их взаимодействие).
+
==Критерий Пейджа==
-
Дисперсионный анализ относится к группе параметрических методов и поэтому его следует применять только тогда, когда доказано, что распределение является нормальным. (Суходольский Г.В., 1972; Шеффе Г., 1980).
+
Нередко условия эксперимента таковы, что обработки упорядочены естественным образом, например, по интенсивности стимулов, сложности заданий и т.п. Критерий Пейджа учитывает информацию, содержащуюся в предпологаемой ''упорядоченности'' (в отличие от критерия Фридмана, статистика которого принимает одно и то же значение для всех перенумераций обработок).
-
==Цель дисперсионного анализа==
+
Для проверки гипотезы
-
Основной целью '''дисперсионного анализа''' (ANOVA) является исследование значимости различия между средними с помощью сравнения (анализа) дисперсий. Разделение общей дисперсии на несколько источников, позволяет сравнить дисперсию, вызванную различием между группами, с дисперсией, вызванной внутригрупповой изменчивостью. При истинности [[Нулевая гипотеза| нулевой гипотезы]] (о равенстве средних в нескольких группах наблюдений, выбранных из генеральной совокупности), оценка дисперсии, связанной с внутригрупповой изменчивостью, должна быть близкой к оценке межгрупповой дисперсии. Если вы просто сравниваете средние в двух [[выборка]]х, дисперсионный анализ даст тот же результат, что и обычный [[Критерий Стьюдента|t-критерий]] для независимых [[выборка|выборок]] (если сравниваются две независимые группы объектов или наблюдений) или [[Критерий Стьюдента|t-критерий]] для зависимых [[выборка|выборок]] (если сравниваются две переменные на одном и том же множестве объектов или наблюдений).
+
<tex> H_0: \beta_1 = \dots = \beta_k </tex>
-
==Модель дисперсионного анализа==
+
против альтернативы возрастания эффектов обработок
-
==Примеры задач==
+
<tex> H_2: \beta_1 \leq \dots \leq \beta_k </tex>,
-
==Перечень методов==
+
где хотя бы одно из неравенств строгое,
-
Разбиение суммы квадратов
+
выполняется [[Критерий Пейджа|статистика критерия Пейджа]] [Холлендер М., Вульф Д.А., 163; Лагутин М. Б., 263]
-
Многофакторный дисперсионный анализ
+
-
Эффекты взаимодействия
+
-
Также смотрите разделы.
+
-
Сложные планы
+
-
Ковариационный анализ (ANCOVA)
+
-
Многомерные планы: многомерный дисперсионный и ковариационный анализ
+
-
Анализ контрастов и апостериорные критерии
+
-
Предположения и эффекты их нарушения
+
-
См. также Методы дисперсионного анализа, Компоненты дисперсии и смешанная модель ANOVA/ANCOVA, а также Планироване эксперимента.
+
===Пример===
 +
'''Прочность волокон хлопка.'''
 +
Проведен опыт, в котором изучалось влияние колличества калорий удобрения, вносимого в почву, на разрывную прочность волокон хлопка. С каждой делянки отбирался один образец хлопка, на котором 4 измерительных показателя прочности по Прессли. Даны данные по этим четырем замерам.
 +
С помощью критерия Пейджа проверить гипотезу об отсутствии влияния количества удобрения на прочность нити, против альтернативы убывания прочности с ростом количества удобрения.
-
Дисперсионный анализ (ANOVA) [Лапач, 193, Кулаичев, 170]. Модели факторного эксперимента. Примеры: факторы, влияющие на успешность решения математических задач; факторы, влияющие на объёмы продаж. Однофакторная параметрическая модель: метод Шефе. Однофакторная непараметрическая модель: критерии Краскела-Уоллиса, Джонкхиера. Общий случай модели с постоянными факторами, теорема Кокрена. Двухфакторная непараметрическая модель: критерии Фридмана [Лапач, 203], Пейджа. Примеры: сравнение эффективности методов производства, агротехнических приёмов. Двухфакторный нормальный анализ. Задача ковариационного анализа.
 
-
Дисперсионный анализ (ANOVA)
 
-
[Лапач, 193, Кулаичев, 170].
 
-
* Модели факторного эксперимента. Примеры: факторы, влияющие на успешность решения математических задач; факторы, влияющие на объёмы продаж.
 
-
* [[Однофакторная параметрическая модель]]: метод Шеффе.
 
-
* [[Однофакторная непараметрическая модель]]: [[критерий Краскела-Уоллиса]], [[критерий Джонкхиера]].
 
-
* Общий случай модели с постоянными факторами, теорема Кокрена.
 
-
* [[Двухфакторная непараметрическая модель]]: [[критерий Фридмана]] [Лапач, 203], [[критерий Пейджа]]. Примеры: сравнение эффективности методов производства, агротехнических приёмов.
 
-
* [[Двухфакторный нормальный анализ]].
 
-
* [[Ковариационный анализ]] (постановка задачи).
 
-
==История==
 
-
 
-
Откуда произошло название '''Дисперсионный анализ'''? Может показаться странным, что процедура сравнения средних называется дисперсионным анализом. В действительности, это связано с тем, что при исследовании статистической значимости различия между средними двух (или нескольких) групп, мы на самом деле сравниваем (анализируем) выборочные дисперсии. Фундаментальная концепция дисперсионного анализа предложена Фишером в 1920 году. Возможно, более естественным был бы термин анализ суммы квадратов или анализ вариации, но в силу традиции употребляется термин дисперсионный анализ.
 
-
Первоначально дисперсионный анализ был разработан для обработки данных, полученных в ходе специально поставленных экспериментов, и считался единственным методом, корректно исследующим причинные связи. Метод применялся для оценки экспериментов в растениеводстве. В дальнейшем выяснилась общенаучная значимость дисперсионного анализа для экспериментов в психологии, педагогике, медицине и др.
 
==Литература==
==Литература==
-
(для книг)
+
 
# ''Шеффе Г.'' Дисперсионный анализ. — М., 1980.
# ''Шеффе Г.'' Дисперсионный анализ. — М., 1980.
 +
# ''Аренс Х.'' ''Лёйтер Ю.'' Многомерный дисперсионный анализ.
 +
# ''Лапач С. Н. , Чубенко А. В., Бабич П. Н.'' Статистика в науке и бизнесе. — Киев: Морион, 2002.
 +
# ''Лагутин М. Б.'' Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003.
 +
# ''Холлендер М., Вульф Д.А.'' Непараметрические методы статистики.
-
==Ссылки==
 
-
(для ссылок на внешние URL)
 
== Ссылки ==
== Ссылки ==
-
* [http://www.statsoft.ru/home/textbook/modules/stanman.html Дисперсионный анализ] — Электронный учебник StatSoft.
+
 
-
* [http://www.tspu.tula.ru/res/math/mop/lections/lection_7.htm#_Toc73845987 Дисперсионный анализ] - Аналитическая статистика.
+
* [http://www.tspu.tula.ru/res/math/mop/lections/lection_7.htm#_Toc73845987 Дисперсионный анализ для связанных выборок] - Аналитическая статистика.
-
* [http://en.wikipedia.org/wiki/Student%27s_t-test Student's t-test] (Wikipedia).
+
* [http://lib.socio.msu.ru/l/library?e=d-000-00---001ucheb--00-0-0-0prompt-10---4------0-1l--1-ru-50---20-about---00031-001-1-0windowsZz-1251-00&a=d&cl=CL1&d=HASHe10c3b36c7d751dd18704b.11 Многофакторный дисперсионный анализ] - Электронная библиотека.
-
* [http://ru.wikipedia.org/wiki/%D0%9A%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9_%D0%A1%D1%82%D1%8C%D1%8E%D0%B4%D0%B5%D0%BD%D1%82%D0%B0 t-критерий Стьюдента] (Википедия).
+
-
* [http://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5_%D0%A1%D1%82%D1%8C%D1%8E%D0%B4%D0%B5%D0%BD%D1%82%D0%B0 Распределение Стьюдента] (Википедия).
+
-
* [http://ru.wikipedia.org/wiki/%D0%9A%D0%B2%D0%B0%D0%BD%D1%82%D0%B8%D0%BB%D0%B8_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D1%8F_%D0%A1%D1%82%D1%8C%D1%8E%D0%B4%D0%B5%D0%BD%D1%82%D0%B0 Квантили распределения Стьюдента] (Википедия).
+
==См. также==
==См. также==
-
(для ссылок на страницы внутри Ресурса).
+
 
-
* [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез.
+
* [[Однофакторная параметрическая модель]]
-
* [[Статистика (функция выборки)]]
+
* [[Однофакторная непараметрическая модель]]
 +
* [[Дисперсионный анализ]]
[[Категория:Прикладная статистика]]
[[Категория:Прикладная статистика]]
[[Категория:Дисперсионный анализ]]
[[Категория:Дисперсионный анализ]]

Текущая версия

Содержание

Двухфакторная непараметрическая модель

Данные.

В каждом из n блоков содержится по одному наблюдению x_{ij} на каждуб из k обработок. Будем считать наблюдения реализацией случайных велечин X_{ij} в модели

X_{ij} = \mu + \alpha_i + \beta_j + \epsilon_{ij}, где 1 \le i \le n, 1 \le j \le k, .

Здесь \mu - неизвестное общее среднее, \alpha_i - эффект блока i (неизвестный мешающий параметр), \beta_j - эффект блока j (интересующий нас параметр), \epsilon_{ij} - случайная ошибка j

Допущения.

1. Все ошибки \epsilon_{ij} независимы.

2. Все \epsilon_{ij} имеют одинаковое непрерывное (неизвестное) распределение.

Критерий Фридмана

Для проверки гипотезы

 H_0: \beta_1 = \dots = \beta_k

против альтернативы

 H_1 : не все  \beta_j равны между собой

применяется Критерий Фридмана [Холлендер М., Вульф Д.А., 155; Лагутин М. Б., 260]

Пример

Д. Хебб и К.Уильямс разработали тест эстакадного лабиринта для сравнительной оценки "сообразительности" животных. Он состоит из 12 заданий. Есть данные средних чисел ошибок при выполнении этих заданий крысами, кроликами и кошками. Есть ли животные, которые значимо различаются?

Критерий Пейджа

Нередко условия эксперимента таковы, что обработки упорядочены естественным образом, например, по интенсивности стимулов, сложности заданий и т.п. Критерий Пейджа учитывает информацию, содержащуюся в предпологаемой упорядоченности (в отличие от критерия Фридмана, статистика которого принимает одно и то же значение для всех перенумераций обработок).

Для проверки гипотезы

 H_0: \beta_1 = \dots = \beta_k

против альтернативы возрастания эффектов обработок

 H_2: \beta_1 \leq \dots \leq  \beta_k ,

где хотя бы одно из неравенств строгое,

выполняется статистика критерия Пейджа [Холлендер М., Вульф Д.А., 163; Лагутин М. Б., 263]

Пример

Прочность волокон хлопка.

Проведен опыт, в котором изучалось влияние колличества калорий удобрения, вносимого в почву, на разрывную прочность волокон хлопка. С каждой делянки отбирался один образец хлопка, на котором 4 измерительных показателя прочности по Прессли. Даны данные по этим четырем замерам. С помощью критерия Пейджа проверить гипотезу об отсутствии влияния количества удобрения на прочность нити, против альтернативы убывания прочности с ростом количества удобрения.



Литература

  1. Шеффе Г. Дисперсионный анализ. — М., 1980.
  2. Аренс Х. Лёйтер Ю. Многомерный дисперсионный анализ.
  3. Лапач С. Н. , Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002.
  4. Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003.
  5. Холлендер М., Вульф Д.А. Непараметрические методы статистики.

Ссылки

См. также

Личные инструменты