Статистический анализ данных (курс лекций, К.В.Воронцов)/2011
Материал из MachineLearning.
м (→Задания) |
м (→Пример задания) |
||
Строка 17: | Строка 17: | ||
Исследуем чувствительность классического двухвыборочного [[Критерий Стьюдента|критерия Стьюдента]] для проверки гипотезы однородности против [[Гипотеза сдвига|альтернативы сдвига]] при зашумлении выборок наблюдениями, взятыми из равномерного распределения. | Исследуем чувствительность классического двухвыборочного [[Критерий Стьюдента|критерия Стьюдента]] для проверки гипотезы однородности против [[Гипотеза сдвига|альтернативы сдвига]] при зашумлении выборок наблюдениями, взятыми из равномерного распределения. | ||
- | <tex>x^n \sim 0.9\cdot N(\mu_1,1)+ 0.1\cdot U\left[-5+\mu_1,5+\mu_1\right]</tex> — выборка длины <tex>n</tex> из смеси стандартного нормального <tex>N(\mu_1,1)</tex> и равномерного <tex>U\left[-5+\mu_1,5+\mu_1\right]</tex> распределений с весами <tex>0.9</tex> и <tex>0.1</tex> соответственно (при генерации выборки используется случайный датчик — если его значение не превосходит <tex>0.9</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного). <br> | + | <tex>x^n, \;\; x \sim 0.9\cdot N(\mu_1,1)+ 0.1\cdot U\left[-5+\mu_1,5+\mu_1\right]</tex> — выборка длины <tex>n</tex> из смеси стандартного нормального <tex>N(\mu_1,1)</tex> и равномерного <tex>U\left[-5+\mu_1,5+\mu_1\right]</tex> распределений с весами <tex>0.9</tex> и <tex>0.1</tex> соответственно (при генерации выборки используется случайный датчик — если его значение не превосходит <tex>0.9</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного). <br> |
- | <tex>y^n \sim 0.9\cdot N(\mu_2,1)+ 0.1\cdot U\left[-5+\mu_2,5+\mu_2\right]</tex> — аналогичная выборка. <br> | + | <tex>y^n, \;\; y \sim 0.9\cdot N(\mu_2,1)+ 0.1\cdot U\left[-5+\mu_2,5+\mu_2\right]</tex> — аналогичная выборка. <br> |
- | <tex>H_0\,:\; \ | + | <tex>H_0\,:\; \mathbb{E}(x)=\mathbb{E}(y), \;\; H_1\,:\; \mathbb{E}(x)\neq\mathbb{E}(y).</tex> |
- | + | ||
- | + | ||
<tex>\mu_1=0, \;\; \mu_2=-2\,:\,0.01\,:\,2, \;\; n=15\,:\,5\,:\,200.</tex> | <tex>\mu_1=0, \;\; \mu_2=-2\,:\,0.01\,:\,2, \;\; n=15\,:\,5\,:\,200.</tex> | ||
Строка 36: | Строка 34: | ||
Заметим, что однократная генерация выборок даёт достаточно нестабильные результаты, не позволяя точно оценить границы области, где нулевая гипотеза отклоняется, поэтому и необходимо усреднение по большому числу экспериментов. | Заметим, что однократная генерация выборок даёт достаточно нестабильные результаты, не позволяя точно оценить границы области, где нулевая гипотеза отклоняется, поэтому и необходимо усреднение по большому числу экспериментов. | ||
- | Видно, что при достаточно большой разнице между средними и большом размере выборок наличие шума не мешает уверенно отклонять гипотезу однородности. | + | Видно, что при достаточно большой разнице между средними и большом размере выборок наличие шума не мешает уверенно отклонять гипотезу однородности. Когда, наоборот, разница между средними невелика (меньше 0.2-0.5 в зависимости от размера выборок), мощность близка к нулю, а среднее достигаемого уровня значимости колеблется около 0.5, что логично, так как его распределение при справедливости нулевой гипотезы равномерно на <tex>[0,1]</tex>. |
Чтобы оценить вклад зашумления выборок, оценим при всех значениях параметра мощность критерия и средний достигаемый уровень значимости на аналогичных выборках без шума и сравним результаты. | Чтобы оценить вклад зашумления выборок, оценим при всех значениях параметра мощность критерия и средний достигаемый уровень значимости на аналогичных выборках без шума и сравним результаты. |
Версия 19:25, 2 октября 2011
|
Задание 1. Исследование свойств одномерных статистических критериев на модельных данных
Необходимо провести исследование одного или нескольких классических критериев проверки статистических гипотез. Интерес представляет поведение достигаемого уровня значимости (p-value) как функции размера выборок и параметров распределения. В соответствии с индивидуальными параметрами задания необходимо указанным способом сгенерировать одну или несколько выборок из заданного распределения, выполнить проверку гипотезы при помощи соответствующего критерия, а затем многократно повторить эту процедуру для различных значений параметров. По результатам расчётов необходимо построить требуемые в задании графики, среди которых могут быть следующие:
- график зависимости достигаемого уровня значимости от значений параметров при однократном проведении эксперимента;
- график зависимости достигаемого уровня значимости одного или двух критериев от значений параметров, усреднённого по большому количеству повторений эксперимента (например, по 1000 повторений);
- график с эмпирическими оценками мощности одного или двух критериев для разных значений параметров.
В качестве оценки мощности принимается доля отвержений нулевой гипотезы среди всех проверок. То есть, если эксперимент повторялся раз для каждого набора значений параметра, и в из случаев гипотеза была отвергнута на некотором фиксированном уровне значимости (примем ), оценкой мощности будет отношение .
Необходимо сдать: выполненный в LaTex или Microsoft Word отчёт с описанием алгоритма, построенными графиками и выводами (объяснение полученных результатов моделирования, границы применимости критерия и т.д.), а также *.m-файл или R-скрипт, при запуске которого на экран выводятся графики, соответствующие имеющимся в отчёте.
Задание принимается до первого ноября.
Пример задания
Исследуем чувствительность классического двухвыборочного критерия Стьюдента для проверки гипотезы однородности против альтернативы сдвига при зашумлении выборок наблюдениями, взятыми из равномерного распределения.
— выборка длины из смеси стандартного нормального и равномерного распределений с весами и соответственно (при генерации выборки используется случайный датчик — если его значение не превосходит , то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного).
— аналогичная выборка.
При каждом значении выборки для разных значений генерируются независимо.
Заметим, что однократная генерация выборок даёт достаточно нестабильные результаты, не позволяя точно оценить границы области, где нулевая гипотеза отклоняется, поэтому и необходимо усреднение по большому числу экспериментов.
Видно, что при достаточно большой разнице между средними и большом размере выборок наличие шума не мешает уверенно отклонять гипотезу однородности. Когда, наоборот, разница между средними невелика (меньше 0.2-0.5 в зависимости от размера выборок), мощность близка к нулю, а среднее достигаемого уровня значимости колеблется около 0.5, что логично, так как его распределение при справедливости нулевой гипотезы равномерно на .
Чтобы оценить вклад зашумления выборок, оценим при всех значениях параметра мощность критерия и средний достигаемый уровень значимости на аналогичных выборках без шума и сравним результаты.
Видно, что наличие шума всё меньше влияет на работу критерия с ростом объёма выборок и разницы между их средними. Тем не менее, в некоторых областях изменения параметров потеря мощности из-за 10% зашумления может составлять до 20%, а средний достигаемый уровень значимости может быть выше на 0.1.
Отметим, что приведённые количественные выводы справедливы только для шума рассматриваемой структуры.
Задания
Анализ чувствительности критериев к редактированию выборки
Известно, что исключение из выборки определённых наблюдений зачастую может достаточно сильно повлиять на результат анализа. Необходимо исследовать чувствительность указанного критерия к редактированию выборки, построить графики, сделать выводы.
На каждом шаге генерируются выборки исходной длины, проводится проверка гипотезы , затем по некоторому правилу из указанной выборки исключается один из элементов, проверка гипотезы повторяется, затем исключается ещё один, и т.д. Обозначим за максимальное число исключённых в таком процессе элементов; примем во всех задачах .
- Двухвыборочный критерий Стьюдента для связных выборок.
- Алешина Мария: на каждом шаге исключается пара наблюдений разность которых максимальна.
- Антипов Григорий: на каждом шаге исключается пара наблюдений разность которых минимальна.
- Критерий Уилкоксона-Манна-Уитни для независимых выборок.
- Батурина Вера: на каждом шаге исключается максимальный элемент выборки .
- Бондаренко Николай: на каждом шаге исключается максимальный элемент выборки .
- Валов Дмитрий: на каждом шаге исключается минимальный элемент выборки .
- Критерий Фишера для проверки равенства дисперсий.
- Головин Антон: на каждом шаге исключается максимальный по модулю элемент выборки .
- Дударенко Мария: на каждом шаге исключается минимальный по модулю элемент выборки .
- Исупова Ольга: на каждом шаге исключается максимальный элемент выборки .
- Касперский Иван: на каждом шаге исключается минимальный элемент выборки .
Устойчивость критериев к нарушению предположения нормальности
Исследовать поведение параметрических критериев, предполагающих нормальность данных, при зашумлении выборок наблюдениями, взятыми из равномерного распределения.
- Двухвыборочный критерий Стьюдента для связных выборок
— связанная с ней выборка, полученная добавлением компоненты из смеси нормального и равномерного распределений с весами и соответственно (при генерации выборки используется случайный датчик — если его значение не превосходит , то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного),
- Колев Денис:
- Колесников Александр:
- Макарова Елена:
- Критерий Фишера для проверки равенства дисперсий.
— выборка длины из смеси нормального и равномерного распределений с весами и соответственно (при генерации выборки используется случайный датчик — если его значение не превосходит , то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного),
— аналогичная выборка,
- Миняйлов Владимир:
- Молчанов Андрей:
- Онищенко Алина:
Анализ поведения разновидностей критерия Стьюдента
Критерий Стьюдента может явно учитывать дополнительную информацию о дисперсии выборок и их структуре. Необходимо исследовать, какой выигрыш даёт эта информация, сравнив мощности и средние достигаемые уровни значимости вариантов критериев при различных значениях параметров.
- Парный критерий Стьюдента и версия для независимых выборок и неизвестных неравных дисперсий.
- Платонова Елена:
- Семенов Олег:
- Критерий Стьюдента для независимых выборок, версии для неизвестных и известных неравных дисперсий.
- Сидоров Юрий:
- Солодкин Дмитрий:
- Парный критерий Стьюдента и версия для независимых выборок и известных неравных дисперсий.
(cогласно свойствам нормального распределения, .)
- Суворов Михаил:
- Тихонов Андрей: