Статистический анализ данных (курс лекций, К.В.Воронцов)/2010

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м
Строка 1: Строка 1:
-
= Задание 1. Исследование статистических критериев на модельных данных =
+
= Задание 1. Исследование свойств одномерных статистических критериев на модельных данных =
-
Необходимо провести исследование одного из классических критериев проверки статистических гипотез. Интерес представляет поведение
+
Необходимо провести исследование одного или нескольких классических критериев проверки статистических гипотез. Интерес представляет поведение
-
[[Достигаемый уровень значимости|достигаемого уровня значимости]] (p-value) как функции размера выборок и параметров распределения. В соответствии с индивидуальными параметрами задания необходимо сгенерировать одну или несколько выборок из указанного распределения, выполнить [[Проверка статистических гипотез|проверку гипотезы]] при помощи соответствующего критерия, а затем многократно повторить эту процедуру для различных значений параметров. При этом, в зависимости от индивидуальных особенностей задания, выборки могут как генерироваться заново для каждого значения объёма выборки <tex>n</tex>, так и образовываться путём добавления одного элемента к уже имеющейся выборке объёма <tex>n-1</tex>. По результатам расчётов необходимо построить указанные в задании графики, среди которых могут быть следующие:
+
[[Достигаемый уровень значимости|достигаемого уровня значимости]] (p-value) как функции размера выборок и параметров распределения. В соответствии с индивидуальными параметрами задания необходимо указанным способом сгенерировать одну или несколько выборок из заданного распределения, выполнить [[Проверка статистических гипотез|проверку гипотезы]] при помощи соответствующего критерия, а затем многократно повторить эту процедуру для различных значений параметров. По результатам расчётов необходимо построить требуемые в задании графики, среди которых могут быть следующие:
-
* график зависимости достигаемого уровня значимости от значений параметров при однократном проведении эксперимента;
+
# график зависимости достигаемого уровня значимости от значений параметров при однократном проведении эксперимента;
-
* график зависимости достигаемого уровня значимости от значений параметров, усреднённого по нескольким десяткам экспериментов;
+
# график зависимости достигаемого уровня значимости от значений параметров, усреднённого по большому количеству повторений эксперимента (например, по 100, 500, 1000 повторений);
-
* график с эмпирическими оценками [[Мощность критерия|мощности критерия]] для разных значений параметров.
+
# график с эмпирическими оценками [[Мощность критерия|мощности критерия]] для разных значений параметров.
В качестве оценки мощности принимается доля отвержений нулевой гипотезы среди всех проверок. То есть, если эксперимент повторялся <tex>k</tex> раз для каждого набора значений параметра, и в <tex>m</tex> из <tex>k</tex> случаев гипотеза была отвергнута на некотором фиксированном уровне значимости <tex>\alpha</tex> (примем <tex>\alpha=0.05</tex>), оценкой мощности будет отношение <tex>m/k</tex>.
В качестве оценки мощности принимается доля отвержений нулевой гипотезы среди всех проверок. То есть, если эксперимент повторялся <tex>k</tex> раз для каждого набора значений параметра, и в <tex>m</tex> из <tex>k</tex> случаев гипотеза была отвергнута на некотором фиксированном уровне значимости <tex>\alpha</tex> (примем <tex>\alpha=0.05</tex>), оценкой мощности будет отношение <tex>m/k</tex>.
Строка 11: Строка 11:
Необходимо сдать: выполненный в LaTex или Microsoft Word отчёт с описанием алгоритма, построенными графиками и '''выводами (объяснение полученных результатов моделирования, границы применимости критерия и т.д.)''', а также *.m-файл.
Необходимо сдать: выполненный в LaTex или Microsoft Word отчёт с описанием алгоритма, построенными графиками и '''выводами (объяснение полученных результатов моделирования, границы применимости критерия и т.д.)''', а также *.m-файл.
-
== Пример выполнения задания ==
+
== Пример задания ==
-
Исследуем поведение классического двухвыборочного [[Критерий Стьюдента|критерия Стьюдента]] для проверки гипотезы однородности против [[Гипотеза сдвига|альтернативы сдвига]].
+
Исследуем поведение классического двухвыборочного [[Критерий Стьюдента|критерия Стьюдента]] для проверки гипотезы однородности против [[Гипотеза сдвига|альтернативы сдвига]] при разных значениях параметров.
 +
 
<tex>x^n = (x_1,\ldots,x_n)\sim N(\mu_1,\sigma),\;\; y^n = (y_1,\ldots,y_n)\sim N(\mu_2,\sigma);</tex>
<tex>x^n = (x_1,\ldots,x_n)\sim N(\mu_1,\sigma),\;\; y^n = (y_1,\ldots,y_n)\sim N(\mu_2,\sigma);</tex>
Строка 19: Строка 20:
<tex>H_1\,:\; \mu_1\neq\mu_2.</tex>
<tex>H_1\,:\; \mu_1\neq\mu_2.</tex>
-
Параметры задачи принимают следующие значения:
+
<tex>\sigma = 1; \;\;\; \mu_1=0; \;\;\; \mu_2=0\,:\,0.05\,:\,3; \;\;\; n=5\,:\,1\,:\,50.</tex>
-
 
+
-
<tex>\sigma = 1; \;\;\; \mu_1=0; \;\;\; \mu_2=0\,:\,0,05\,:\,3; \;\;\; n=5\,:\,1\,:\,50.</tex>
+
При каждом значении <tex>\mu_2</tex> выборки для разных значений <tex>n</tex> генерируются независимо.
При каждом значении <tex>\mu_2</tex> выборки для разных значений <tex>n</tex> генерируются независимо.
-
График значений достигаемого уровня значимости при однократной генерации выборок:
+
<gallery widths="250px" heights="250px">
 +
Изображение:Answer.jpg|График 1: значения достигаемого уровня значимости при однократной генерации выборок.
 +
Изображение:Answer2.jpg|График 2: значения достигаемого уровня значимости, усрёднённые по 100 экспериментам.
 +
Изображение:Answer3.jpg|График 3: значения эмпирических оценок мощности критерия при проведении 100 экспериментов (<tex>\alpha=0.05</tex>).
 +
</gallery>
 +
 
 +
== Задания==
 +
=== Анализ устойчивости критериев к нарушению предположений ===
 +
* Исследовать устойчивость одновыборочного [[Критерий Стьюдента|критерия Стьюдента]] к нарушению предположения о нормальности данных. <tex>x^n</tex>&nbsp;— смесь распределений <tex>N(\mu,1)</tex> и <tex>U[-a+\mu,a+\mu]</tex> с весами <tex>p</tex> и <tex>1-p</tex> соответственно (при генерации выборки используется случайный датчик&nbsp;— если его значение не превосходит <tex>p</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе&nbsp;— элемент, взятый из равномерного). Для разных значений параметров выборки генерируются независимо. <br> <tex>H_0\,:\; \mu=0, \;\; H_1\,:\; \mu\neq 0;</tex> <br> <tex>p=0\,:\,0.02\,:\,1; \;\; \mu=-1\,:\,0.05\,:\,1; \;\; n=100.</tex> <br> Построить графики вида 1, 2, 3, сделать выводы о чувствительности критерия к зашумлению выборки.
-
[[Изображение:Answer.jpg|500px]]
+
: Студент 1:&nbsp;<tex>a=1.</tex>
 +
: Студент 2:&nbsp;<tex>a=5.</tex>
 +
: Студент 3:&nbsp;<tex>a=10.</tex>
-
График значений достигаемого уровня значимости, усрёднённых по 100 экспериментам:
+
* Исследовать устойчивость двухвыборочного [[Критерий Стьюдента|критерия Стьюдента]] для независимых выборок к нарушению предположения о нормальности данных. <tex>x^n \sim N(\mu_1,1),</tex> <tex>y^n</tex>&nbsp;— смесь распределений <tex>N(\mu_2,1)</tex> и <tex>U[-a+\mu_2,a+\mu_2]</tex> с весами <tex>p</tex> и <tex>1-p</tex> соответственно (при генерации выборки используется случайный датчик&nbsp;— если его значение не превосходит <tex>p</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе&nbsp;— элемент, взятый из равномерного). Для разных значений параметров выборки генерируются независимо. <br> <tex>H_0\,:\; \mu_1=\mu_2, \;\; H_1\,:\; \mu_1\neq\mu_2;</tex> <br> <tex>\mu_1=0; \;\; p=0\,:\,0.02\,:\,1; \;\; \mu_2=-1\,:\,0.05\,:\,1; \;\; n=100.</tex> <br> Построить графики вида 1, 2, 3, сделать выводы о чувствительности критерия к зашумлению одной из выборок.
-
[[Изображение:Answer2.jpg|500px]]
+
: Студент 8:&nbsp;<tex>a=1.</tex>
 +
: Студент 9:&nbsp;<tex>a=5.</tex>
 +
: Студент 10:&nbsp;<tex>a=10.</tex>
-
График значений эмпирических оценок мощности критерия при проведении 100 экспериментов (<tex>\alpha=0.05</tex>):
+
=== Анализ чувствительности критериев к редактированию выборки===
 +
* Известно, что исключение из выборки определённых наблюдений зачастую может достаточно сильно повлиять на результат анализа. Необходимо исследовать чувствительность одновыборочного критерия [[Критерий Стьюдента|критерия Стьюдента]] к редактированию выборки. <br> <tex>x^n \sim N(\mu,\sigma);</tex> <br> <tex>H_0\,:\; \mu=0, \;\;\; H_1\,:\; \mu>0.</tex> <br> При каждом значении параметра <tex>\mu</tex> генерируется выборка размера <tex>n</tex>, проводится проверка гипотезы <tex>H_0</tex>, затем по некоторому правилу из выборки исключается один из элементов, проверка гипотезы повторяется, затем исключается ещё один, и&nbsp;т.д. Обозначим за <tex>K</tex> максимальное число исключённых в таком процессе элементов. Построить графики вида 1, 2, 3, сделать выводы о чувствительности критерия к редактированию выборки.
-
[[Изображение:Answer3.jpg|500px]]
+
: Студент 4:&nbsp;<tex>n=100;\;\;K=50;\;\;\sigma=1;\;\;\mu=-1\,:\,0.01\,:\,1;\;\;</tex> на каждом шаге исключается максимальный элемент.
 +
: Студент 5:&nbsp;<tex>n=200;\;\;K=100;\;\;\sigma=5;\;\;\mu=-2\,:\,0.02\,:\,2;\;\;</tex> на каждом шаге исключается максимальный элемент.
 +
: Студент 6:&nbsp;<tex>n=100;\;\;K=50;\;\;\sigma=1;\;\;\mu=-1\,:\,0.01\,:\,1;\;\;</tex> на каждом шаге исключается минимальный элемент.
 +
: Студент 7:&nbsp;<tex>n=200;\;\;K=100;\;\;\sigma=5;\;\;\mu=-2\,:\,0.02\,:\,2;\;\;</tex> на каждом шаге исключается минимальный элемент.
-
[[Категория:Учебные курсы]]
+
=== Анализ поведения схожих критериев ===
 +
Требуется исследовать поведение пары статистических критериев, решающих одну и ту же задачу, и сделать выводы о границах их применимости. Необходимо сделать вывод о том, в каких областях изменения параметров предпочтительнее использовать тот или иной критерий.

Версия 16:32, 11 сентября 2010

Содержание

Задание 1. Исследование свойств одномерных статистических критериев на модельных данных

Необходимо провести исследование одного или нескольких классических критериев проверки статистических гипотез. Интерес представляет поведение достигаемого уровня значимости (p-value) как функции размера выборок и параметров распределения. В соответствии с индивидуальными параметрами задания необходимо указанным способом сгенерировать одну или несколько выборок из заданного распределения, выполнить проверку гипотезы при помощи соответствующего критерия, а затем многократно повторить эту процедуру для различных значений параметров. По результатам расчётов необходимо построить требуемые в задании графики, среди которых могут быть следующие:

  1. график зависимости достигаемого уровня значимости от значений параметров при однократном проведении эксперимента;
  2. график зависимости достигаемого уровня значимости от значений параметров, усреднённого по большому количеству повторений эксперимента (например, по 100, 500, 1000 повторений);
  3. график с эмпирическими оценками мощности критерия для разных значений параметров.

В качестве оценки мощности принимается доля отвержений нулевой гипотезы среди всех проверок. То есть, если эксперимент повторялся k раз для каждого набора значений параметра, и в m из k случаев гипотеза была отвергнута на некотором фиксированном уровне значимости \alpha (примем \alpha=0.05), оценкой мощности будет отношение m/k.

Необходимо сдать: выполненный в LaTex или Microsoft Word отчёт с описанием алгоритма, построенными графиками и выводами (объяснение полученных результатов моделирования, границы применимости критерия и т.д.), а также *.m-файл.

Пример задания

Исследуем поведение классического двухвыборочного критерия Стьюдента для проверки гипотезы однородности против альтернативы сдвига при разных значениях параметров.

x^n = (x_1,\ldots,x_n)\sim N(\mu_1,\sigma),\;\; y^n = (y_1,\ldots,y_n)\sim N(\mu_2,\sigma);

H_0\,:\; \mu_1=\mu_2,

H_1\,:\; \mu_1\neq\mu_2.

\sigma = 1; \;\;\; \mu_1=0; \;\;\; \mu_2=0\,:\,0.05\,:\,3; \;\;\;  n=5\,:\,1\,:\,50.

При каждом значении \mu_2 выборки для разных значений n генерируются независимо.

Задания

Анализ устойчивости критериев к нарушению предположений

  • Исследовать устойчивость одновыборочного критерия Стьюдента к нарушению предположения о нормальности данных. x^n — смесь распределений N(\mu,1) и U[-a+\mu,a+\mu] с весами p и 1-p соответственно (при генерации выборки используется случайный датчик — если его значение не превосходит p, то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного). Для разных значений параметров выборки генерируются независимо.
    H_0\,:\; \mu=0, \;\; H_1\,:\; \mu\neq 0;
    p=0\,:\,0.02\,:\,1; \;\;  \mu=-1\,:\,0.05\,:\,1; \;\; n=100.
    Построить графики вида 1, 2, 3, сделать выводы о чувствительности критерия к зашумлению выборки.
Студент 1: a=1.
Студент 2: a=5.
Студент 3: a=10.
  • Исследовать устойчивость двухвыборочного критерия Стьюдента для независимых выборок к нарушению предположения о нормальности данных. x^n \sim N(\mu_1,1), y^n — смесь распределений N(\mu_2,1) и U[-a+\mu_2,a+\mu_2] с весами p и 1-p соответственно (при генерации выборки используется случайный датчик — если его значение не превосходит p, то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного). Для разных значений параметров выборки генерируются независимо.
    H_0\,:\; \mu_1=\mu_2, \;\; H_1\,:\; \mu_1\neq\mu_2;
    \mu_1=0; \;\; p=0\,:\,0.02\,:\,1; \;\;  \mu_2=-1\,:\,0.05\,:\,1; \;\; n=100.
    Построить графики вида 1, 2, 3, сделать выводы о чувствительности критерия к зашумлению одной из выборок.
Студент 8: a=1.
Студент 9: a=5.
Студент 10: a=10.

Анализ чувствительности критериев к редактированию выборки

  • Известно, что исключение из выборки определённых наблюдений зачастую может достаточно сильно повлиять на результат анализа. Необходимо исследовать чувствительность одновыборочного критерия критерия Стьюдента к редактированию выборки.
    x^n \sim N(\mu,\sigma);
    H_0\,:\; \mu=0, \;\;\; H_1\,:\; \mu>0.
    При каждом значении параметра \mu генерируется выборка размера n, проводится проверка гипотезы H_0, затем по некоторому правилу из выборки исключается один из элементов, проверка гипотезы повторяется, затем исключается ещё один, и т.д. Обозначим за K максимальное число исключённых в таком процессе элементов. Построить графики вида 1, 2, 3, сделать выводы о чувствительности критерия к редактированию выборки.
Студент 4: n=100;\;\;K=50;\;\;\sigma=1;\;\;\mu=-1\,:\,0.01\,:\,1;\;\; на каждом шаге исключается максимальный элемент.
Студент 5: n=200;\;\;K=100;\;\;\sigma=5;\;\;\mu=-2\,:\,0.02\,:\,2;\;\; на каждом шаге исключается максимальный элемент.
Студент 6: n=100;\;\;K=50;\;\;\sigma=1;\;\;\mu=-1\,:\,0.01\,:\,1;\;\; на каждом шаге исключается минимальный элемент.
Студент 7: n=200;\;\;K=100;\;\;\sigma=5;\;\;\mu=-2\,:\,0.02\,:\,2;\;\; на каждом шаге исключается минимальный элемент.

Анализ поведения схожих критериев

Требуется исследовать поведение пары статистических критериев, решающих одну и ту же задачу, и сделать выводы о границах их применимости. Необходимо сделать вывод о том, в каких областях изменения параметров предпочтительнее использовать тот или иной критерий.

Личные инструменты