Участник:Riabenko/tmp
Материал из MachineLearning.
Задание 2. Проверка гипотез на реальных данных
Требуется подобрать и применить наилучший статистический метод, позволяющий ответить на вопрос прикладной задачи. Обосновать применимость метода и его оптимальность. Помимо выводов, касающихся математических особенностей решения, необходимо в терминах предметной области сформулировать выводы, которые могли бы быть понятны гипотетическому заказчику-нематематику.
Необходимо сдать: подробный отчёт по проведённому исследованию, содержащий визуализацию исходных данных, описания и выводы каждого этапа анализа — используемые методы, обоснование их применимости, промежуточные результаты вычислений, графики.
Задание принимается до 23:59 22.03.
Подстраница с индивидуальными постановками задач.
- Студент 3: производитель богатых клетчаткой крекеров рассматривает возможность построить рекламную кампанию
- Студент 4: оценка объёма устриц
- Студент 6: 12 родителей
Цифры числа пи
Даны первые десять тысяч цифр числи пи.
- Студент 1: Можно ли сказать, что все цифры встречаются с одинаковой частотой? Есть ли корреляция между подряд идущими цифрами?
Maryland's Pick-3 Lottery
Даны результаты розыгрыша лотереи Maryland's Pick-3 Lottery за 218 подряд идущих дней. Результатом является трёхзначное число.
- Студент 2: можно ли считать розыгрыш случайным?
Вакцина против вируса папилломы человека
Собраны данные по 1413 пациенткам клиник при университете Джона Хопкинса, проходившим с 2006 по 2008 вакцинацию против папилломавируса человека препаратом Гардасил. Рекомендуемый курс — три укола в течение года — был пройдён только 469 пациентками. Производитель препарата исследует, в каких демографических группах и каком способе получения вакцины проведение полного курса наиболее вероятно.
- Студент 7: оценить влияние клиники и её расположения на число сделанных пациенткам уколов.
- Студент 8: связаны ли возраст и раса с готовностью прохождения полного курса вакцинации в течение года?
- Студент 9: связаны ли с готовностью прохождения полного курса вакцинации в течение года тип медицинской страховки и специализация порекомендовавшего вакцинацию врача?
Размеры черепа древних египтян
Измерено 150 черепов, найденных при раскопках в Египте. Находки относятся к пяти различным временным периодам. Для каждого черепа известны: максимальная ширина, базибрегматическая высота, базиальвеолярная длина, высота носа, примерная дата формирования.
- Студент 10: проверить, есть ли различия между размерами черепов различных временных периодов, если есть, то какие периоды отличаются друг от друга.
Условия размножения штаммов золотистого стафилококка
При подозрении на инфекционное заболевание для правильной постановки диагноза часто бывает важно из взятых у пациентов образцов вырастить как можно более многочисленную колонию бактерий, чтобы её было удобнее исследовать. Считается, что оптимальные параметры для размножения штаммов стафилококка в лабораторных условиях следующие: температура 35 градусов, концентрация триптона в питательном растворе 1.0%, время выдержки 24 часа. Для проверки оптимальности этих условий было проведено 30 экспериментов над пятью различными штаммами стафилококка. Для каждого из экспериментов известны время выдержки, температура, концентрация триптона, а также измеренное по окончании выдержки число колониеобразующих единиц (КОЕ) бактерий каждого штамма.
- Студент 11: одинакова ли зависимость итогового числа КОЕ разных штаммов стафилококка от внешних условий?
Засеивание облаков и уровень осадков
Исследовалось воздействие засеивания облаков на обилие дождей. Измерения проводились в течение 108 периодов на пяти участках земли в Тасмании — участки обозначены в файле как западный, восточный, южный, северный и северо-восточный. В выборке содержатся данные об уровне осадков (в миллиметрах) на каждом из пяти участков, о времени года, к которому относится период, и о том, проводилось ли засеивание.
- Студент 12: проверить, как засеивание облаков повлияло на уровень осадков отдельно по каждому из пяти экспериментальных участков. Одинаково ли проявляется эффект засеивания на каждом из них, или, возможно, он как-то зависит от исходного уровня осадков на участке?
Продолжительность жизни раковых больных
Выборка состоит из 64 пациентов, у которых был диагностирован неизлечимый рак какого-либо органа. Всем им в качестве поддерживающей терапии был назначен к приёму витамин C (считалось, что он может способствовать выздоровлению раковых больных). Приведены данные об остаточной продолжительности жизни пациентов в днях.
- Студент 13: исследовать связь между остаточной продолжительностью жизни и типом рака.
Краш-тест с манекенами
Имеются результаты 352 краш-тестов, при которых происходило лобовое столкновение автомобилей с бетонной стеной на скорости около 60 км/ч. Измерены показатели повреждения манекенов: критерий тяжести повреждений головы, замедление грудной клетки, нагрузка на левое и правое бедро.
- Студент 14: исследовать зависимость показателей повреждения от типа кузова, вида средств защиты, места манекена.
Продолжительность жизни и активность размножения самцов дрозофилы
Для изучения влияния активности размножения самцов дрозофилы на продолжительность их жизни был организован следующий эксперимент. По 25 самцов в пяти группах содержались в одинаковых условиях, за исключением одного отличия: в первой группе к каждому самцу ежедневно подсаживалась готовая к размножению самка, во второй — восемь готовых к размножению самок, в третьей и четвёртой — соответственно, одна и восемь беременных самок, не готовых к размножению, наконец, к самцам четвёртой группы не подсаживали никого. Для каждого самца измерена продолжительность жизни, длина грудной клетки и доля времени, проводимого во сне.
- Студент 15: исследовать связь между продолжительностью жизни самцов дрозофилы и наличием самок разного типа и количества.
Линька metacarcinus magister
У 472 самок metacarcinus magister измерена ширина панциря до и после линьки. Часть особей проживала в лаборатории, часть — в естественной среде обитания; для последних известен также год вылова.
- Студент 16: исследовать различия между изменениями размеров панциря особей, линька которых проходила в лабораторных условиях и в естественных; для последних оценить влияние года вылова.
Пассажиры Титаника
Приведены данные о 1309 пассажирах Титаника. Для каждого пассажира указано имя, пол, возраст, класс и цена билета, число родственников на борту, и, кроме того, удалось ли ему выжить.
- Студент 17: по каким признакам отличаются выжившие пассажиры от погибших?
Эффективность раскройки джинсов
Для пяти поставщиков фабрики Levi's в Альбукерке имеются данные по доле материала, попадающего в обрезки; из всех величин вычтена средняя доля обрезков, получающаяся при оптимизации раскройки с помощью компьютера.
- Студент 18: есть ли различия между поставщиками?
Прочность промышленных вентиляторов
Измерен разрушающий крутящий момент 64 промышленных вентиляторов; для каждого известны тип отверстия, форма барабана и метод соединения.
- Студент 19: связан ли разрушающий крутящий момент с характеристиками вентилятора?
Размер яиц кукушки
Известно, что кукушки откладывают яйца в гнёзда других птиц. Даны длины 115 яиц кукушки, найденных в гнёздах птиц 6 видов.
- Студент 20: как размер яйца зависит от вида птицы, в чьём гнезде оно было найдено?
Рак лёгких в Китае
Для участников исследования, проживающих в одном из восьми городов Китая, известно, курят ли они и больны ли раком лёгких.
- Студент 5: как связаны риск заболевания раком лёгких, курение и город проживания участников исследования?