Статистический анализ данных (курс лекций, К.В.Воронцов)/2010
Материал из MachineLearning.
Содержание |
Задания
Анализ устойчивости критериев к нарушению предположений
- Исследовать устойчивость одновыборочного критерия Стьюдента к нарушению предположения о нормальности данных. — смесь распределений и с весами и соответственно (при генерации выборки используется случайный датчик — если его значение не превосходит , то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного). Для разных значений параметров выборки генерируются независимо.
Построить графики вида 1, 2, 3, сделать выводы о чувствительности критерия к зашумлению выборки.
- Студент 1:
- Студент 2:
- Студент 3:
- Исследовать устойчивость двухвыборочного критерия Стьюдента для независимых выборок к нарушению предположения о нормальности данных. — смесь распределений и с весами и соответственно (при генерации выборки используется случайный датчик — если его значение не превосходит , то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного). Для разных значений параметров выборки генерируются независимо.
Построить графики вида 1, 2, 3, сделать выводы о чувствительности критерия к зашумлению одной из выборок.
- Студент 8:
- Студент 9:
- Студент 10:
Анализ чувствительности критериев к редактированию выборки
- Известно, что исключение из выборки определённых наблюдений зачастую может достаточно сильно повлиять на результат анализа. Необходимо исследовать чувствительность одновыборочного критерия критерия Стьюдента к редактированию выборки.
При каждом значении параметра генерируется выборка размера , проводится проверка гипотезы , затем по некоторому правилу из выборки исключается один из элементов, проверка гипотезы повторяется, затем исключается ещё один, и т.д. Обозначим за максимальное число исключённых в таком процессе элементов. Построить графики вида 1, 2, 3, сделать выводы о чувствительности критерия к редактированию выборки.
- Студент 4: на каждом шаге исключается максимальный элемент.
- Студент 5: на каждом шаге исключается максимальный элемент.
- Студент 6: на каждом шаге исключается минимальный элемент.
- Студент 7: на каждом шаге исключается минимальный элемент.
Анализ поведения схожих критериев
Требуется исследовать поведение указанной пары статистических критериев, проверяющих одну и ту же гипотезу, сравнить мощность и достигаемые уровни значимости и сделать выводы о границах применимости критериев. Необходимо для каждого из критериев построить графики вида 1, 2, 3, и показать, в каких областях изменения параметров предпочтительнее использовать тот или иной критерий.
- Студент 11: двухвыборочный критерий Стьюдента для независимых выборок и критерий Уилкоксона-Манна-Уитни.
- Студент 12: двухвыборочный критерий Стьюдента для связных выборок и критерий Уилкоксона для связных выборок.
- Студент 13: двухвыборочные критерий Стьюдента для связных и независимых выборок.
- Студент 14: критерий Уилкоксона-Манна-Уитни и медианный критерий.
- Студент 15: критерий Уилкоксона для связных выборок и критерий знаков.