Статистический анализ данных (курс лекций, К.В.Воронцов)/2010
Материал из MachineLearning.
(Различия между версиями)
м |
м |
||
Строка 1: | Строка 1: | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
== Задания== | == Задания== | ||
=== Анализ устойчивости критериев к нарушению предположений === | === Анализ устойчивости критериев к нарушению предположений === | ||
Строка 53: | Строка 22: | ||
=== Анализ поведения схожих критериев === | === Анализ поведения схожих критериев === | ||
- | Требуется исследовать поведение пары статистических критериев, | + | Требуется исследовать поведение указанной пары статистических критериев, проверяющих одну и ту же гипотезу, сравнить мощность и достигаемые уровни значимости и сделать выводы о границах применимости критериев. Необходимо для каждого из критериев построить графики вида 1, 2, 3, и показать, в каких областях изменения параметров предпочтительнее использовать тот или иной критерий. |
+ | * <tex>x^n \sim N(0,1),\;\;y^n \sim N(\mu,1);</tex> <br> <tex>H_0\,:\; \mu=0, \;\;\; H_1\,:\; \mu\neq 0; </tex> <br> <tex>\mu=-2\,:\,0.02\,:\,2;\;\; n=10\,:\,5\,:\,100.</tex> | ||
+ | |||
+ | : Студент 11: двухвыборочный [[критерий Стьюдента]] для независимых выборок и [[критерий Уилкоксона-Манна-Уитни]]. | ||
+ | : Студент 12: двухвыборочный [[критерий Стьюдента]] для связных выборок и [[критерий Уилкоксона для связных выборок]]. | ||
+ | : Студент 13: двухвыборочные [[критерий Стьюдента]] для связных и независимых выборок. | ||
+ | : Студент 14: [[критерий Уилкоксона-Манна-Уитни]] и [[медианный критерий]]. | ||
+ | : Студент 15: [[критерий Уилкоксона для связных выборок]] и [[критерий знаков]]. | ||
[[Категория:Учебные курсы]] | [[Категория:Учебные курсы]] |
Версия 18:20, 12 сентября 2010
Содержание |
Задания
Анализ устойчивости критериев к нарушению предположений
- Исследовать устойчивость одновыборочного критерия Стьюдента к нарушению предположения о нормальности данных. — смесь распределений и с весами и соответственно (при генерации выборки используется случайный датчик — если его значение не превосходит , то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного). Для разных значений параметров выборки генерируются независимо.
Построить графики вида 1, 2, 3, сделать выводы о чувствительности критерия к зашумлению выборки.
- Студент 1:
- Студент 2:
- Студент 3:
- Исследовать устойчивость двухвыборочного критерия Стьюдента для независимых выборок к нарушению предположения о нормальности данных. — смесь распределений и с весами и соответственно (при генерации выборки используется случайный датчик — если его значение не превосходит , то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного). Для разных значений параметров выборки генерируются независимо.
Построить графики вида 1, 2, 3, сделать выводы о чувствительности критерия к зашумлению одной из выборок.
- Студент 8:
- Студент 9:
- Студент 10:
Анализ чувствительности критериев к редактированию выборки
- Известно, что исключение из выборки определённых наблюдений зачастую может достаточно сильно повлиять на результат анализа. Необходимо исследовать чувствительность одновыборочного критерия критерия Стьюдента к редактированию выборки.
При каждом значении параметра генерируется выборка размера , проводится проверка гипотезы , затем по некоторому правилу из выборки исключается один из элементов, проверка гипотезы повторяется, затем исключается ещё один, и т.д. Обозначим за максимальное число исключённых в таком процессе элементов. Построить графики вида 1, 2, 3, сделать выводы о чувствительности критерия к редактированию выборки.
- Студент 4: на каждом шаге исключается максимальный элемент.
- Студент 5: на каждом шаге исключается максимальный элемент.
- Студент 6: на каждом шаге исключается минимальный элемент.
- Студент 7: на каждом шаге исключается минимальный элемент.
Анализ поведения схожих критериев
Требуется исследовать поведение указанной пары статистических критериев, проверяющих одну и ту же гипотезу, сравнить мощность и достигаемые уровни значимости и сделать выводы о границах применимости критериев. Необходимо для каждого из критериев построить графики вида 1, 2, 3, и показать, в каких областях изменения параметров предпочтительнее использовать тот или иной критерий.
- Студент 11: двухвыборочный критерий Стьюдента для независимых выборок и критерий Уилкоксона-Манна-Уитни.
- Студент 12: двухвыборочный критерий Стьюдента для связных выборок и критерий Уилкоксона для связных выборок.
- Студент 13: двухвыборочные критерий Стьюдента для связных и независимых выборок.
- Студент 14: критерий Уилкоксона-Манна-Уитни и медианный критерий.
- Студент 15: критерий Уилкоксона для связных выборок и критерий знаков.