Участник:Riabenko/tmp

Материал из MachineLearning.

< Участник:Riabenko(Различия между версиями)
Перейти к: навигация, поиск
м
Текущая версия (19:11, 25 сентября 2018) (править) (отменить)
м
 
(43 промежуточные версии не показаны)
Строка 1: Строка 1:
-
===Эффективность тромболитической терапии===<!---cardio.xls--->
+
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2009|Практические задания для студентов каф. ММП ВМК (2009 год)]]
-
Собраны данные по 206 пациентам второго кардиологического отделения московской городской клинической больницы №25. Имеются результаты 14 анализов, а также 8 дополнительных признаков, описывающих пациента (пол, возраст, курение, наличие диабета и т.д.)
+
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2010|Практические задания для студентов каф. ММП ВМК (2010 год)]]
-
::: построить функцию, оценивающую вероятность выздоровления пациента в результате тромболитической терапии по приведённым 22 признакам.
+
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2011, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2011 год)]]
-
::: построить функцию, оценивающую вероятность возникновения осложнений у пациента в результате тромболитической терапии по приведённым 22 признакам.
+
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2011|Практические задания для студентов каф. ММП ВМК (2011 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2012, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2012 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2012|Практические задания для студентов каф. ММП ВМК (2012 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2013, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2013 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2013|Практические задания для студентов каф. ММП ВМК (2013 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2014, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2014 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2014|Практические задания для студентов каф. ММП ВМК (2014 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2015|Практические задания для студентов каф. ММП ВМК (2015 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2015, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2015 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2016, ММП|Практические задания для студентов каф. ММП ВМК (2016 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2016, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2016 год)]]
-
===Лесные пожары в парке Монтезинью===<!---forest_fires.csv--->
+
<tex>
-
[[Изображение:Park.png‎|200px|thumb|Парк Монтезинью, разбиение на зоны.]]
+
\frac{1}{\sum_i { N_{X_i}}} \left(\sum_i { N_{X_i} \mu_{X_i}}\right) +1.96 \sqrt{\frac{1}{\sum_i {N_{X_i} - 1}} \left( \sum_i { \left[(N_{X_i} - 1) \sigma_{X_i}^2 + N_{X_i} \mu_{X_i}^2\right] } - \left[\sum_i {N_{X_i}}\right]\mu_X^2 \right) }
-
Данные собраны в 2001-2003 годах в португальском природном парке Монтезинью. Известны: месяц и день недели, температура воздуха, относительная влажность, скорость ветра, число выпавших осадков, значения четырёх метеорологических индексов, координаты зоны, в которой были произведены эти измерения (см. рис.), а также площадь леса, уничтоженного произошедшим в этот день пожаром (если он был).
+
</tex>
-
::: построить модель, позволяющую оценить по рассматриваемым признакам вероятность пожара и доверительный интервал для неё.
+
-
 
+
-
===Преступность и демографические характеристики===<!---crimes.xlsx--->
+
-
Данные собраны из переписи населения США 1990 года, отчёта ФБР о преступности за 1995 год и опроса сотрудников полиции LEMAS за 1990 год. По 2215 округам собрана статистика преступлений и 125 демографических показателей.
+
-
::: построить функцию, оценивающую число поджогов на сто тысяч населения по демографическим показателям, дать интерпретацию коэффициентов модели.
+
-
::: построить функцию, оценивающую число ненасильственных преступлений на сто тысяч населения по демографическим показателям, дать интерпретацию коэффициентов модели.
+
-
 
+
-
===Линька крабов===<!---crabs.csv--->
+
-
У 472 самок metacarcinus magister измерена ширина панциря до и после линьки. Часть особей проживала в лаборатории, часть&nbsp;— в естественной среде обитания; для последних известен также год вылова.
+
-
::: построить модель изменения размеров панциря с учётом всех факторов.
+
-
 
+
-
===Пожертвования на благотворительность===<!---charity.xlsx--->
+
-
Благотворительная организация разослала 4268 писем с предложением сделать пожертвование и получила отклик с пожертвованиями от 1707 адресатов. Для каждого адресата известны: индикатор ответа на предыдущее письмо, число недель, прошедших с момента предыдущего пожертвования, размеры текущего, предыдущего и среднего по всем предыдущим пожертвованиям в голландских гульденах, число писем, отправляемых адресату в год, доля писем, в ответ на которые приходят пожертвования.
+
-
::: построить функцию, оценивающую вероятный размер пожертвования от адресата по историческим данным.
+
-
 
+
-
===Состав бетона===<!---concrete.xlsx--->
+
-
Для 103 образцов раствора бетона известно содержание в кубическом метре семи основных компонент, для каждого образца измерены также осадка, растекание и прочность на сжатие.
+
-
::: построить функцию, оценивающую растекание бетона по его составу.
+
-
::: построить функцию, оценивающую прочность бетона на сжатие по всем имеющимся характеристикам, оценить вклад растекания и осадки.
+
-
 
+
-
===Внешний вид и привлекательность самок мечехвостов===<!---horseshoe crab.txt--->
+
-
Изучалось влияние внешних характеристик самок морских ракообразных мечехвостов на их привлекательность для самцов. Выборка состоит из данных о наблюдениях над 173 особями и содержит закодированные данные о размере самок, их весе, цвете, состоянии панциря, а также о количестве спутников.
+
-
::: построить функцию, по внешним параметрам самки предсказывающую, будет ли у неё хотя бы один спутник. Оценить значимость каждого фактора.
+
-
 
+
-
===Данные антропометрии===<!---body.xlsx--->
+
-
[[Изображение:Antropometry.jpg|120px|thumb|Некоторые из измеренных характеристик скелета.]]
+
-
Для 247 мужчин и 260 женщин измерены две группы антропометрических показателей&nbsp;– легко измеримые характеристики скелета и обхваты, всего 21 признак. Указаны возраст, пол, вес и рост.
+
-
::: построить функцию, эффективно оценивающую вес по наименьшему набору признаков; сравнить точность оценки веса при отсутствии информации по обхватам и отсутствии информации по характеристикам скелета.
+
-
::: построить функцию, оценивающую по наименьшему набору признаков вероятность того, что испытуемый&nbsp;— женщина, и доверительный интервал для этой вероятности.
+
-
 
+
-
===Диагностика заболеваний позвоночника===<!---spine.csv--->
+
-
Для 310 испытуемых измерены: наклон и смещение таза, угол изгиба поясницы, наклон плоскости тазовой поверхности крестца, радиус таза, степень смещения позвонков. Каждый из испытуемых либо здоров, либо болен спондилолистезом или межпозвонковой грыжей.
+
-
::: построить функцию, предсказывающую вероятность наличия каждого из рассматриваемых заболеваний позвоночника, и доверительные интервалы для них.
+
-
 
+
-
===Стоимость подержанных автомобилей=== <!---cars.xls--->
+
-
Имеются данные о стоимости 804 подержанных автомобилей и их характеристиках: известны пробег, производитель, модель, вид модели, тип кузова, число цилиндров, объём двигателя, число дверей, а также наличие или отсутствие круиз контроля, продвинутой звуковой системы и кожаной обивки сидений.
+
-
::: построить модель стоимости автомобиля по данному набору признаков.
+

Текущая версия


\frac{1}{\sum_i { N_{X_i}}} \left(\sum_i { N_{X_i} \mu_{X_i}}\right) +1.96  \sqrt{\frac{1}{\sum_i {N_{X_i} - 1}} \left( \sum_i { \left[(N_{X_i} - 1) \sigma_{X_i}^2 + N_{X_i} \mu_{X_i}^2\right] } - \left[\sum_i {N_{X_i}}\right]\mu_X^2 \right) }

Личные инструменты