м |
м |
(75 промежуточных версий не показаны.) |
Строка 1: |
Строка 1: |
- | = Задание 3. Регрессионные задачи =
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2009|Практические задания для студентов каф. ММП ВМК (2009 год)]] |
- | Требуется подобрать и применить наилучший статистический метод, позволяющий ответить на вопрос прикладной задачи; обосновать выбор метода, его применимость и оптимальность. Помимо выводов, касающихся математических особенностей решения, необходимо в терминах предметной области сформулировать выводы, которые могли бы быть понятны гипотетическому заказчику-нематематику.
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2010|Практические задания для студентов каф. ММП ВМК (2010 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2011, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2011 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2011|Практические задания для студентов каф. ММП ВМК (2011 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2012, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2012 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2012|Практические задания для студентов каф. ММП ВМК (2012 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2013, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2013 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2013|Практические задания для студентов каф. ММП ВМК (2013 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2014, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2014 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2014|Практические задания для студентов каф. ММП ВМК (2014 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2015|Практические задания для студентов каф. ММП ВМК (2015 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2015, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2015 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2016, ММП|Практические задания для студентов каф. ММП ВМК (2016 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2016, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2016 год)]] |
| | | |
- | Необходимо сдать: подробный отчёт по проведённому исследованию, содержащий визуализацию исходных данных, описания и выводы каждого этапа анализа — используемые методы, обоснование их применимости, графики.
| + | <tex> |
- | | + | \frac{1}{\sum_i { N_{X_i}}} \left(\sum_i { N_{X_i} \mu_{X_i}}\right) +1.96 \sqrt{\frac{1}{\sum_i {N_{X_i} - 1}} \left( \sum_i { \left[(N_{X_i} - 1) \sigma_{X_i}^2 + N_{X_i} \mu_{X_i}^2\right] } - \left[\sum_i {N_{X_i}}\right]\mu_X^2 \right) } |
- | Отчёт каждого студента рецензируется назначенным одногруппником. Задачей рецензента является проверка корректности выбора метода решения, полноты его применения и понятности изложения. Рецензент получает балл, если:
| + | </tex> |
- | * его собственная работа засчитана;
| + | |
- | * либо в рецензируемой работе устранены все недостатки и она принимается с первого раза, либо указан полный список недостатков работы, устранить которые не удалось.
| + | |
- | Предварительные версии отчётов принимаются до '''23:59 20.04''', финальные, по результатам работы с рецензентом — до '''23:59 28.04'''.
| + | |
- | | + | |
- | | + | |
- | [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2014, ФУПМ/3|Подстраница с индивидуальными постановками задач]].
| + | |
- | | + | |
- | | + | |
- | ===Преступность и демографические характеристики===<!---http://archive.ics.uci.edu/ml/datasets/Communities+and+Crime+Unnormalized#--->
| + | |
- | Данные собраны из переписи населения США 1990 года, отчёта ФБР о преступности за 1995 год и опроса сотрудников полиции LEMAS за 1990 год. По 2215 округам собрана статистика преступлений и 125 демографических показателей.
| + | |
- | ::Студент 8: построить функцию, оценивающую число поджогов на сто тысяч населения по демографическим показателям, дать интерпретацию коэффициентов модели.
| + | |
- | ::Студент 9: построить функцию, оценивающую абсолютное число автомобильных краж по демографическим показателям, дать интерпретацию коэффициентов модели.
| + | |
- | ::Студент 19: построить функцию, оценивающую число ненасильственных преступлений на сто тысяч населения по демографическим показателям, дать интерпретацию коэффициентов модели.
| + | |
- | | + | |
- | ===Линька крабов===<!---crabs.csv--->
| + | |
- | У 472 самок metacarcinus magister измерена ширина панциря до и после линьки. Часть особей проживала в лаборатории, часть — в естественной среде обитания; для последних известен также год вылова.
| + | |
- | ::Студент 15: построить модель изменения размеров панциря с учётом всех факторов.
| + | |
- | | + | |
- | ===Влияние глифосата на рост плевел===<!---plevel.txt--->
| + | |
- | [[Изображение:Illustration Lolium temulentum0.jpg|120px|thumb|Плевел (Lolium temulentum).]]
| + | |
- | Сравниваются два вида плевел, дикая разновидность и мутантная, выработавшая устойчивость к глифосату. Оба вида в равных пропорциях засеиваются в теплицу, проводится обработка глифосатом, по окончании эксперимента измеряются плотности зарастания (количество растений на единицу площади) дикой <tex>x</tex> и мутантной <tex>z</tex> разновидностей. Целевой признак <tex>y</tex> - средняя биомасса дикой разновидности (в граммах на одно растение). Для него предложена следующая модель:<br> <tex>y=\frac{a}{1+b\left(x+cz\right)}</tex>,<br> где коэффициент <tex>a</tex> имеет смысл гипотетической средней биомассы при нулевой плотности зарастания, <tex>b</tex> – коэффициент внутривидовой конкуренции для дикой разновидности, <tex>c</tex> – коэффициент взаимозаменяемости видов (если он равен единице, то виды взаимозаменяемы.
| + | |
- | ::Студент 1: найти значения коэффициентов <tex>a, b, c,</tex> построить для них доверительные области, оценить качество построенной модели. Можно ли сказать, что виды взаимозаменяемы?
| + | |
- | | + | |
- | ===Пожертвования на благотворительность===<!---charity.xlsx--->
| + | |
- | Благотворительная организация разослала 4268 писем с предложением сделать пожертвование и получила отклик с пожертвованиями от 1707 адресатов. Для каждого адресата известны: индикатор ответа на предыдущее письмо, число недель, прошедших с момента предыдущего пожертвования, размеры текущего, предыдущего и среднего по всем предыдущим пожертвованиям в голландских гульденах, число писем, отправляемых адресату в год, доля писем, в ответ на которые приходят пожертвования.
| + | |
- | ::Студент 2: построить функцию, оценивающую вероятность получения пожертвования от адресата по историческим данным.
| + | |
- | ::Студент 3: построить функцию, оценивающую вероятный размер пожертвования от адресата по историческим данным.
| + | |
- | | + | |
- | ===Вкус португальского вина===<!---wine.xlsx--->
| + | |
- | Для 1599 образцов красного и 4898 белого португальского вина известны оценки (от 0 до 10), выставленные дегустаторами при слепом тестировании, а также значения одиннадцати биохимических показателей, полученных при лабораторном анализе.
| + | |
- | ::Студент 4: построить модель экспертной оценки по биохимическим характеристикам, оценить влияние содержания алкоголя на экспертную оценку.
| + | |
- | ::Студент 5: построить функцию, оценивающую вероятность того, что вино, для которого известны биохимические характеристики и экспертная оценка, является красным, и доверительный интервал для неё. Оценить влияние экспертной оценки на эту вероятность.
| + | |
- | | + | |
- | ===Состав бетона===<!---concrete.xlsx--->
| + | |
- | Для 103 образцов раствора бетона известно содержание в кубическом метре семи основных компонент, для каждого образца измерены также осадка, растекание и прочность на сжатие.
| + | |
- | ::Студент 6: построить функцию, оценивающую растекание бетона по его составу.
| + | |
- | ::Студент 7: построить функцию, оценивающую прочность бетона на сжатие по всем имеющимся характеристикам, оценить вклад растекания и осадки.
| + | |
- | | + | |
- | ===Внешний вид и привлекательность самок мечехвостов===<!---horseshoe crab.txt--->
| + | |
- | Изучалось влияние внешних характеристик самок морских ракообразных мечехвостов на их привлекательность для самцов. Выборка состоит из данных о наблюдениях над 173 особями и содержит закодированные данные о размере самок, их весе, цвете, состоянии панциря, а также о количестве спутников.
| + | |
- | ::Студент 10: построить функцию, по внешним параметрам самки предсказывающую количество спутников у самки. Оценить значимость каждого фактора.
| + | |
- | | + | |
- | ===Данные антропометрии===<!---body.xlsx--->
| + | |
- | [[Изображение:Antropometry.jpg|120px|thumb|Некоторые из измеренных характеристик скелета.]] | + | |
- | Для 247 мужчин и 260 женщин измерены две группы антропометрических показателей – легко измеримые характеристики скелета и обхваты, всего 21 признак. Указаны возраст, пол, вес и рост.
| + | |
- | ::Студент 11: построить функцию, эффективно оценивающую вес по наименьшему набору признаков; сравнить точность оценки веса при отсутствии информации по обхватам и отсутствии информации по характеристикам скелета.
| + | |
- | ::Студент 12: построить функцию, оценивающую возраст по имеющимся признакам; сравнить эффективность оценки возраста при отсутствии информации по обхватам и отсутствии информации по характеристикам скелета.
| + | |
- | ::Студент 13: построить функцию, оценивающую по наименьшему набору признаков вероятность того, что испытуемый — женщина, и доверительный интервал для этой вероятности.
| + | |
- | | + | |
- | ===Надёжность шарикоподшипников===<!---bearing.xlsx--->
| + | |
- | Мерой надёжности шарикоподшипников служит величина <tex>L_{10}</tex> — максимальное число оборотов, которое выдерживает 90% одинаковых подшипников. Имеются данные измерений надёжности по шарикоподшипникам трёх производителей (для одного из производителей исследовано три вида подшипников), для каждого испытания указаны диаметр и число шаров в подшипнике, нагрузка и величина <tex>L_{10}</tex>.
| + | |
- | ::Студент 14: построить функцию, оценивающую <tex>L_{10}</tex> по имеющимся признакам, рассчитать точность оценки.
| + | |
- | | + | |
- | ===Электрическая прочность диэлектрика===<!---dielectric.txt--->
| + | |
- | Была измерена электрическая прочность изоляции проводов на разных сроках их эксплуатации и при различной температуре. Известно, что зависимость электрической прочности диэлектрика от времени и температуры имеет вид <tex>\log(y)=\beta_1-\beta_2\cdot time \cdot e^{-\beta_3\cdot temperature}+\epsilon</tex>.
| + | |
- | ::Студент 16: найти значения констант <tex>\beta_1, \beta_2, \beta_3,</tex> построить для них доверительные области, оценить качество построенной модели.
| + | |
- | | + | |
- | ===Диагностика заболеваний позвоночника===<!---spine.csv--->
| + | |
- | Для 310 испытуемых измерены: наклон и смещение таза, угол изгиба поясницы, наклон плоскости тазовой поверхности крестца, радиус таза, степень смещения позвонков. Каждый из испытуемых либо здоров, либо болен спондилолистезом или межпозвонковой грыжей.
| + | |
- | ::Студент 17: построить функцию, предсказывающую вероятность наличия заболевания позвоночника, и доверительный интервал для неё.
| + | |
- | ::Студент 18: построить функцию, предсказывающую вероятность наличия каждого из рассматриваемых заболеваний позвоночника, и доверительные интервалы для них.
| + | |