Статистический анализ данных (курс лекций, К.В.Воронцов)/2014, ФУПМ
Материал из MachineLearning.
м (→Оценки) |
м (→Оценки) |
||
Строка 28: | Строка 28: | ||
|| Воронов Сергей || 1 || 1 || || || || || 4 || 6 | || Воронов Сергей || 1 || 1 || || || || || 4 || 6 | ||
|- | |- | ||
- | || Гринчук Олег || 1|| 1 || || || || || || | + | || Гринчук Олег || 1|| 1 || || || || || 2 || 4 |
|- | |- | ||
|| Катруца Александр || 1 || 1 || || || || || 2 || 4 | || Катруца Александр || 1 || 1 || || || || || 2 || 4 |
Версия 13:52, 9 апреля 2014
|
Оценки
Студент | №1 (1 б.) | №2 (1 б.) | №3 (2 б.) | Рецензирование №3 (1 б.) | №4 (2 б.) | Рецензирование №4 (1 б.) | Дополнительно | |
---|---|---|---|---|---|---|---|---|
Старожилец Всеволод | 1 | 1 | 2 | |||||
Вялый Евгений | 0.9 | 0.9 | ||||||
Гончаров Фёдор | 1 | 1 | 2 | 4 | ||||
Каледин Станислав | 0.8 | 1 | 1.8 | |||||
Капаев Евгений | 1 | 0.9 | 1.9 | |||||
Коновалов Андрей | 1 | 1 | 2 | 4 | ||||
Кузнецов Роман | 1 | 1 | 2 | |||||
Петров Михаил | 0.7 | 0.7 | ||||||
Хрипко Кирилл | 0.8 | 1 | 1.8 | |||||
Шепелев Денис | 1 | 1 | 2 | |||||
Вдовина Евгения | 1 | 0.9 | 1.9 | |||||
Воронов Сергей | 1 | 1 | 4 | 6 | ||||
Гринчук Олег | 1 | 1 | 2 | 4 | ||||
Катруца Александр | 1 | 1 | 2 | 4 | ||||
Кащеева Мария | 0.9 | 0.8 | 1.7 | |||||
Костин Александр | 0.5 | 0.5 | ||||||
Неклюдов Кирилл | 1 | 1 | 2 | 4 | ||||
Перекрестенко Дмитрий | 1 | 1 | 2 | |||||
Пушняков Алексей | 1 | 1 | 4 | 6 | ||||
Рыскина Мария | 1 | 1 | 2 | |||||
Яшков Даниил | 1 | 1 | 2 | 4 | ||||
Бескровный Александр | 0.7 | 0.6 | 1.3 | |||||
Поляков Сергей | 1 | 1 | ||||||
Соколова Евгения | 1 | 1 | 2 | 4 | ||||
Харченко Наталья | 1 | 1 | 2 | |||||
Балицкий Алексей | 1 | 1 | 2 | 4 | ||||
Довгаль Сергей | 1 | 0.9 | 2 | 3.9 | ||||
Трофимов Михаил | 1 | 1 | 2 | |||||
Папанов Артём | 1 | 1 | 2 | |||||
Мангатаев Доржи | 0.9 | 1 | 1.9 |
- Задание считается сданным на момент получения проверяющим письма с отчётом (и кодом, если это указано в задании), при условии отсутствия необходимости внесения дополнений и исправлений.
- Штраф за просрочку сдачи заданий начисляется из расчета 0.1 балла за сутки.
- Для получения зачёта необходимо сдать как минимум два задания: хотя бы одно из первых двух и хотя бы одно из последних двух.
- Балл за рецензирование можно получить только при условии сдачи соответствующего задания.
- Способы получения дополнительных баллов:
- cертификат по курсу Statistical Learning: https://class.stanford.edu/courses/HumanitiesScience/StatLearning/Winter2014/about (первый дедлайн — 21.03) — 2 балла;
- доклад на занятии — 2 балла.
Доклады
- Неклюдов Кирилл. Двухэтапная проверка равенства средних с помощью критериев Стьюдента и Уэлша.
- Воронов Сергей. Почему многие опубликованные исследования неверны.
- Катруца Александр. Статистическое сравнение классификаторов.
- Пушняков Алексей. Взаимосвязи порядковых признаков.
- Яшков Даниил. Определение скрытых зависимостей переменных при анализе зависимостей.
Задание 1. Исследование свойств одномерных статистических критериев на модельных данных
Необходимо провести исследование одного или нескольких классических критериев проверки статистических гипотез. Интерес представляет поведение достигаемого уровня значимости (p-value) как функции размера выборок и параметров распределения. В соответствии с индивидуальными параметрами задания необходимо указанным способом сгенерировать одну или несколько выборок из заданного распределения, выполнить проверку гипотезы при помощи соответствующего критерия, а затем многократно повторить эту процедуру для различных значений параметров. По результатам расчётов необходимо построить требуемые в задании графики, среди которых могут быть следующие:
- график зависимости достигаемого уровня значимости от значений параметров при однократном проведении эксперимента;
- график зависимости достигаемого уровня значимости одного или двух критериев от значений параметров, усреднённого по большому количеству повторений эксперимента (например, по 1000 повторений);
- график с эмпирическими оценками мощности одного или двух критериев для разных значений параметров.
В качестве оценки мощности принимается доля отвержений нулевой гипотезы среди всех проверок. То есть, если эксперимент повторялся раз для каждого набора значений параметров, и в из случаев гипотеза была отвергнута на некотором фиксированном уровне значимости (примем ), оценкой мощности будет отношение
Необходимо сдать: выполненный в Tex или Microsoft Word отчёт с описанием алгоритма, построенными графиками и выводами (объяснение полученных результатов моделирования, границы применимости критерия и т. д.), а также код на R, Матлабе или Питоне, при запуске которого на экран выводятся графики, соответствующие имеющимся в отчёте.
Задание принимается до 23:59 03.03.
Пример решения: чувствительность двухвыборочного критерия Стьюдента.
Подстраница с индивидуальными постановками задач.
Задание 2. Проверка гипотез на реальных данных
Требуется подобрать и применить наилучший статистический метод, позволяющий ответить на вопрос прикладной задачи; обосновать выбор метода, его применимость и оптимальность. Помимо выводов, касающихся математических особенностей решения, необходимо в терминах предметной области сформулировать выводы, которые могли бы быть понятны гипотетическому заказчику-нематематику.
Необходимо сдать: подробный отчёт по проведённому исследованию, содержащий визуализацию исходных данных, описания и выводы каждого этапа анализа — используемые методы, обоснование их применимости, графики.
Задание принимается до 23:59 2.04.
Подстраница с индивидуальными постановками задач.