Статистический анализ данных (курс лекций, К.В.Воронцов)/2011, ФУПМ
Материал из MachineLearning.
|
Задание 1. Исследование свойств одномерных статистических методов на модельных данных
Необходимо провести исследование одной или нескольких классических статистических техник. В соответствии с индивидуальными параметрами задания необходимо указанным способом сгенерировать одну или несколько выборок из заданного распределения, применить исследуемые статистические методы, а затем многократно повторить эту процедуру для различных значений параметров. По результатам расчётов необходимо построить требуемые в задании графики и сделать выводы.
Пример задания
Исследуем поведение классического двухвыборочного критерия Стьюдента для проверки гипотезы однородности против альтернативы сдвига при разных значениях параметров.
При каждом значении выборки для разных значений генерируются независимо.
Графики 1 и 2 иллюстрируют зависимость достигаемого уровня значимости от размера выборки и среднего . На графике 3 показана зависимость мощности критерия от параметров задачи; мощность в каждой точке оценивается как доля экспериментов, в которых гипотеза была отвергнута на уровне значимости .
- Видно, что при среднее значение достигаемого уровня значимости при многократном повторении эксперимента равно 0.5 для любого размера выборки. Это логично, так как при нулевая гипотеза справедлива, и достигаемый уровень значимости имеет равномерное распределение на
- При и критерий имеет достаточную мощность, и нулевая гипотеза чаще всего отвергается.
- При размере выборки до 50 элементов и среднем второй выборки критерий практически не способен отклонить гипотезу однородности, мощность в этой области изменения параметров низка.
- При большой разнице между средними выборок критерий достаточно уверенно отвергает гипотезу однородности даже на выборках небольшого размера (5-6 элементов).
Задания
Влияние связок на некоторые статистические критерии
Исследовать влияние совпадающих элементов выборки на поведение статистических критериев.
Андерсона-Дарлинга, Уилкоксона (2 шт.), Шапиро-Уилка
Устойчивость критериев к нарушению предположений
- Исследовать устойчивость критерия Фишера для проверки равенства дисперсий к нарушению предположения о нормальности выборок.
— выборка длины из смеси распределений и с весами и соответственно (при генерации выборки используется случайный датчик — если его значение не превосходит , то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного).
— аналогичная выборка.
Построить графики вида 1, 2, 3, сделать выводы о чувствительности критерия к зашумлению.
- Студент 1:
- Студент 2:
- Студент 3:
- Студент 4:
- Студент 5:
- Студент 6:
- Студент 7:
- Студент 8:
Варианты ранжирования в критерии Зигеля-Тьюки
Сравнение методов построение доверительных интервалов
Точность аппроксимации распределения статистик критериев
проблема Беренца-Фишера, аппроксимация ранговых критериев, критерия знаков
Литература
Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.