Статистический анализ данных (курс лекций, К.В.Воронцов)/2014, ФУПМ
Материал из MachineLearning.
|
Оценки
Студент | №1 (1 б.) | №2 (1 б.) | №3 (2 б.) | Рецензирование №3 (1 б.) | №4 (2 б.) | Рецензирование №4 (1 б.) | Дополнительно | |
---|---|---|---|---|---|---|---|---|
Старожилец Всеволод | 1 | 1 | ||||||
Вялый Евгений | 0.9 | 0.9 | ||||||
Гончаров Фёдор | 1 | 1 | ||||||
Каледин Станислав | 0.8 | 0.8 | ||||||
Капаев Евгений | 1 | 1 | ||||||
Коновалов Андрей | 1 | 1 | ||||||
Кузнецов Роман | 1 | 1 | ||||||
Петров Михаил | 0.7 | 0.7 | ||||||
Хрипко Кирилл | 0.8 | 0.8 | ||||||
Шепелев Денис | 1 | 1 | ||||||
Вдовина Евгения | 1 | 1 | ||||||
Воронов Сергей | 1 | 2 | 3 | |||||
Гринчук Олег | 1 | 1 | ||||||
Катруца Александр | 1 | 1 | 2 | 4 | ||||
Кащеева Мария | 0.9 | 0.9 | ||||||
Костин Александр | 0.5 | 0.5 | ||||||
Неклюдов Кирилл | 1 | 1 | 2 | 4 | ||||
Перекрестенко Дмитрий | 1 | 1 | ||||||
Пушняков Алексей | 1 | 1 | ||||||
Рыскина Мария | 1 | 1 | 2 | |||||
Яшков Даниил | 1 | 1 | 2 | |||||
Бескровный Александр | 0.7 | 0.7 | ||||||
Поляков Сергей | ||||||||
Соколова Евгения | 1 | 1 | ||||||
Харченко Наталья | 1 | 1 | ||||||
Балицкий Алексей | 1 | 2 | 3 | |||||
Довгаль Сергей | 1 | 1 | ||||||
Трофимов Михаил | 1 | 1 | ||||||
Папанов Артём | 1 | 1 | ||||||
Мангатаев Доржи | 0.9 | 0.9 |
- Задание считается сданным на момент получения проверяющим письма с отчётом (и кодом, если это указано в задании), при условии отсутствия необходимости внесения дополнений и исправлений.
- Штраф за просрочку сдачи заданий начисляется из расчета 0.1 балла за сутки.
- Для получения зачёта необходимо сдать как минимум два задания: хотя бы одно из первых двух и хотя бы одно из последних двух.
- Балл за рецензирование можно получить только при условии сдачи соответствующего задания.
- Способы получения дополнительных баллов:
- cертификат по курсу Statistical Learning: https://class.stanford.edu/courses/HumanitiesScience/StatLearning/Winter2014/about (первый дедлайн — 21.03) — 2 балла;
- доклад на занятии — 2 балла.
Задание 1. Исследование свойств одномерных статистических критериев на модельных данных
Необходимо провести исследование одного или нескольких классических критериев проверки статистических гипотез. Интерес представляет поведение достигаемого уровня значимости (p-value) как функции размера выборок и параметров распределения. В соответствии с индивидуальными параметрами задания необходимо указанным способом сгенерировать одну или несколько выборок из заданного распределения, выполнить проверку гипотезы при помощи соответствующего критерия, а затем многократно повторить эту процедуру для различных значений параметров. По результатам расчётов необходимо построить требуемые в задании графики, среди которых могут быть следующие:
- график зависимости достигаемого уровня значимости от значений параметров при однократном проведении эксперимента;
- график зависимости достигаемого уровня значимости одного или двух критериев от значений параметров, усреднённого по большому количеству повторений эксперимента (например, по 1000 повторений);
- график с эмпирическими оценками мощности одного или двух критериев для разных значений параметров.
В качестве оценки мощности принимается доля отвержений нулевой гипотезы среди всех проверок. То есть, если эксперимент повторялся раз для каждого набора значений параметров, и в из случаев гипотеза была отвергнута на некотором фиксированном уровне значимости (примем ), оценкой мощности будет отношение
Необходимо сдать: выполненный в Tex или Microsoft Word отчёт с описанием алгоритма, построенными графиками и выводами (объяснение полученных результатов моделирования, границы применимости критерия и т. д.), а также код на R, Матлабе или Питоне, при запуске которого на экран выводятся графики, соответствующие имеющимся в отчёте.
Задание принимается до 23:59 03.03.
Пример решения: чувствительность двухвыборочного критерия Стьюдента.
Подстраница с индивидуальными постановками задач.
Задание 2. Проверка гипотез на реальных данных
Требуется подобрать и применить наилучший статистический метод, позволяющий ответить на вопрос прикладной задачи; обосновать выбор метода, его применимость и оптимальность. Помимо выводов, касающихся математических особенностей решения, необходимо в терминах предметной области сформулировать выводы, которые могли бы быть понятны гипотетическому заказчику-нематематику.
Необходимо сдать: подробный отчёт по проведённому исследованию, содержащий визуализацию исходных данных, описания и выводы каждого этапа анализа — используемые методы, обоснование их применимости, графики.
Задание принимается до 23:59 2.04.
Подстраница с индивидуальными постановками задач.