Статистический анализ данных (курс лекций, К.В.Воронцов)/2015, ФУПМ/1
Материал из MachineLearning.
м |
м |
||
Строка 1: | Строка 1: | ||
- | Ниже под обозначением <tex>X^n, \;\; | + | Ниже под обозначением <tex>X^n, \;\; X \sim p\cdot N(\mu,\sigma^2)+ \left(1-p\right)\cdot F</tex> понимается выборка объёма <tex>n</tex> из смеси нормального распределения <tex>N(\mu,\sigma^2)</tex> и распределения <tex>F</tex> с весами <tex>p</tex> и <tex>1-p</tex> соответственно (при генерации каждой выборки используется случайный датчик — если его значение не превосходит <tex>p</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из распределения F). |
= Анализ поведения схожих критериев = | = Анализ поведения схожих критериев = | ||
Строка 9: | Строка 9: | ||
* <tex>X^n, \;\; X \sim p\cdot N(0,1)+ \left(1-p\right)\cdot F;</tex> <br> <tex> H_0\,:\; X \sim N,</tex> <br> <tex>H_1\,:\; H_0 </tex> неверна. | * <tex>X^n, \;\; X \sim p\cdot N(0,1)+ \left(1-p\right)\cdot F;</tex> <br> <tex> H_0\,:\; X \sim N,</tex> <br> <tex>H_1\,:\; H_0 </tex> неверна. | ||
- | ::Лукманов: <tex>F = C\left(0,1\right)</tex>— стандартное распределение Коши; <tex>n=20\,:\,1\,:\,100, \;\; p=0\,:\,0.01\,:\,1 | + | ::Лукманов: <tex>F = C\left(0,1\right)</tex>— стандартное распределение Коши; <tex>n=20\,:\,1\,:\,100, \;\; p=0\,:\,0.01\,:\,1.</tex> Сравнить критерии Шапиро-Уилка и хи-квадрат Пирсона. |
<!--- | <!--- |
Версия 14:39, 2 марта 2015
Ниже под обозначением понимается выборка объёма из смеси нормального распределения и распределения с весами и соответственно (при генерации каждой выборки используется случайный датчик — если его значение не превосходит , то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из распределения F).
Анализ поведения схожих критериев
Требуется исследовать поведение указанной пары статистических критериев, подходящих для решения одной и той же задачи, сравнить мощность и достигаемые уровни значимости и сделать выводы о границах применимости критериев. Необходимо для каждого из критериев построить графики зависимости достигаемых уровней значимости и оценок мощностей от параметров, и показать, в каких областях изменения параметров предпочтительнее использовать тот или иной критерий. Для получения более гладких графиков рекомендуется применять оба критерия к одним и тем же выборкам, а не генерировать их отдельно для каждого.
-
неверна.
- Лийко: — непрерывные равномерные распределения; Сравнить критерии Смирнова и Крамера-фон Мизеса (функция cvm.test с параметром type="W2" в пакете dgof).
- Ефимова: Сравнить критерии Смирнова и Андерсона (функция cvm.test с параметром type="A2" в пакете dgof).
-
неверна.
- Лукманов: — стандартное распределение Коши; Сравнить критерии Шапиро-Уилка и хи-квадрат Пирсона.