Статистический анализ данных (курс лекций, К.В.Воронцов)/2015, ФУПМ

Материал из MachineLearning.

Перейти к: навигация, поиск

Оценки

Студент Группа №1 (1) №2 (1.2) №3 (2.8) Рецензирование №3 (0.5) №4 (2.8) Рецензирование №4 (0.5) Дополнительно (7) Сумма за семестр (10) Оценка
Аверьянов Ярослав 178
Ахтямов Азат 173
Бондарчук Ярослав 175
Веринов Александр 176
Виденеева Анастасия 177
Газизуллина Римма 174
Ефимова Ирина 174
Жуков Андрей 174
Игнатов Андрей 174
Иноземцев Игорь 177
Карасиков Михаил 174
Костюк Анна 174
Кулунчаков Андрей 174
Кучин Александр 177
Лийко Виктория 176
Липатова Анна 174
Лукманов Вадим 154
Макарова Анастасия 174
Омельченко Сергей 176
Плавин Александр 174
Попова Мария 174
Ракутин Юрий
Родина София 176
Рубцовенко Сергей 176
Усманова Ильнура 173
Фатыхов Булат 177
Циглер Александр 177
Черепанов Ярослав 175
Чжен Евгений 177
Швец Михаил 174
Шинкевич Михаил 174
Яковлева Екатерина 177
  • Задание считается сданным на момент получения письма с отчётом при условии отсутствия необходимости внесения дополнений и исправлений.
  • Штраф за просрочку заданий начисляется из расчёта 0.1 балла за сутки.
  • Для получения зачёта необходимо сдать как минимум два задания: хотя бы одно из первых двух и хотя бы одно из последних двух.
  • Балл за рецензирование можно получить только при условии сдачи соответствующего задания.
  • Источники дополнительных баллов:
  • Итоговая оценка по курсу —  сумма баллов за семестр, округлённая по стандартным правилам.

Задание 1. Исследование свойств одномерных статистических критериев на модельных данных

Необходимо провести исследование одного или нескольких классических критериев проверки статистических гипотез. Интерес представляет поведение достигаемого уровня значимости (p-value) как функции размера выборок и параметров распределения. В соответствии с индивидуальными параметрами задания необходимо указанным способом сгенерировать одну или несколько выборок из заданного распределения, выполнить проверку гипотезы при помощи соответствующего критерия, а затем многократно повторить эту процедуру для различных значений параметров. По результатам расчётов необходимо построить требуемые в задании графики, среди которых могут быть следующие:

  1. график зависимости достигаемого уровня значимости от значений параметров при однократном проведении эксперимента;
  2. график зависимости достигаемого уровня значимости одного или двух критериев от значений параметров, усреднённого по большому количеству повторений эксперимента (например, по 1000 повторений);
  3. график с эмпирическими оценками мощности одного или двух критериев для разных значений параметров.

В качестве оценки мощности принимается доля отвержений нулевой гипотезы среди всех проверок. То есть, если эксперимент повторялся k раз для каждого набора значений параметров, и в m из k случаев гипотеза была отвергнута на некотором фиксированном уровне значимости \alpha (примем \alpha=0.05), оценкой мощности будет отношение m/k.

Необходимо сдать: Rmd и сгенерированный по нему html/pdf-файл с описанием алгоритма, построенными графиками и выводами (объяснение полученных результатов моделирования, границы применимости критерия и т. д.).

Постановки задач.

Пример решения.

Задание принимается до 23:59 12.03.


Ссылки

Личные инструменты