м |
м |
(67 промежуточных версий не показаны.) |
Строка 1: |
Строка 1: |
- | = Задание 4. Прогнозирование =
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2009|Практические задания для студентов каф. ММП ВМК (2009 год)]] |
- | Требуется подобрать и применить наилучший статистический метод, позволяющий ответить на вопрос прикладной задачи; обосновать выбор метода, его применимость и оптимальность. Помимо выводов, касающихся математических особенностей решения, необходимо в терминах предметной области сформулировать выводы, которые могли бы быть понятны гипотетическому заказчику-нематематику.
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2010|Практические задания для студентов каф. ММП ВМК (2010 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2011, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2011 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2011|Практические задания для студентов каф. ММП ВМК (2011 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2012, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2012 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2012|Практические задания для студентов каф. ММП ВМК (2012 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2013, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2013 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2013|Практические задания для студентов каф. ММП ВМК (2013 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2014, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2014 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2014|Практические задания для студентов каф. ММП ВМК (2014 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2015|Практические задания для студентов каф. ММП ВМК (2015 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2015, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2015 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2016, ММП|Практические задания для студентов каф. ММП ВМК (2016 год)]] |
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2016, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2016 год)]] |
| | | |
- | Необходимо сдать: подробный отчёт по проведённому исследованию, содержащий визуализацию исходных данных, описания и выводы каждого этапа анализа — используемые методы, обоснование их применимости, графики.
| + | <tex> |
- | | + | \frac{1}{\sum_i { N_{X_i}}} \left(\sum_i { N_{X_i} \mu_{X_i}}\right) +1.96 \sqrt{\frac{1}{\sum_i {N_{X_i} - 1}} \left( \sum_i { \left[(N_{X_i} - 1) \sigma_{X_i}^2 + N_{X_i} \mu_{X_i}^2\right] } - \left[\sum_i {N_{X_i}}\right]\mu_X^2 \right) } |
- | Отчёт каждого студента рецензируется назначенным одногруппником. Задачей рецензента является проверка корректности выбора метода решения, полноты его применения и понятности изложения. Рецензент получает балл, если:
| + | </tex> |
- | * его собственная работа засчитана;
| + | |
- | * либо в рецензируемой работе устранены все недостатки и она принимается с первого раза, либо указан полный список недостатков работы, устранить которые не удалось.
| + | |
- | Предварительные версии отчётов принимаются до '''23:59 ''', финальные, по результатам работы с рецензентом — до '''23:59 '''.
| + | |
- | | + | |
- | [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2014, ФУПМ/4|Подстраница с индивидуальными постановками задач]].
| + | |
- | | + | |
- | | + | |
- | | + | |
- | ===Уровень безработицы===<!---unemployment-by-sex-and-age-grou.xlsx--->
| + | |
- | Статистическая служба Европейского союза собирает данные по среднемесячному уровню безработицы в тысячах людей с 1983 года.
| + | |
- | ::Студент 1: построить прогноз числа безработных во Франции на каждый месяц до конца 2015 года.
| + | |
- | ::Студент 2: построить прогноз числа безработных в Швеции на каждый месяц до конца 2015 года.
| + | |
- | | + | |
- | ===Смертность в ДТП===<!---number-of-deaths-and-serious-inj.xlsx--->
| + | |
- | Известно число смертей и тяжких телесных повреждений, полученных в результате ДТП в Великобритании за каждый месяц с января 1969 по декабрь 1984.
| + | |
- | ::Студент 3: в феврале 1982 был принят закон об обязательном использовании ремней безопасности. Как можно оценить его эффект?
| + | |
- | | + | |
- | ===Свободные цены на товарном рынке===<!---http://unctadstat.unctad.org/TableViewer/tableView.aspx?ReportId=28768--->
| + | |
- | Конференция ООН по торговле и развитию (ЮНКТАД) собирает ежемесячные данные по свободным ценам на товарном рынке основных продуктов. Имеются данные с января 1960 года по настоящий момент.
| + | |
- | ::Студент 4: спрогнозировать стоимость необработанного табака при импорте в США на каждый месяц до конца 2015 года.
| + | |
- | ::Студент 5: спрогнозировать стоимость бананов при импорте из Центральной Америки в США на каждый месяц до конца 2015 года.
| + | |
- | | + | |
- | ===Длина суток===<!---daytime.xlsx--->
| + | |
- | IERS Earth Orientation Centre располагает данными о среднегодовой длительности суток (она варьируется из-за крупных геологических событий). Для каждого года 1623 по 2005 дано отклонение от идеальной продолжительности суток в миллисекундах.
| + | |
- | ::Студент 6: оценить величину для каждого года с 2006 по 2020.
| + | |
- | | + | |
- | ===Расходы на азартные игры===<!---monthly-gambling-expenditure-in-.xls--->
| + | |
- | На каждый месяц с июля 1999 по ноябрь 2006 года имеются данные о средних дневных расходах на азартные игры суммарно по всем игорным заведениям австралийского штата Виктория, единица измерения – миллион долларов.
| + | |
- | ::Студент 7:построить прогноз на каждый из следующих двенадцати месяцев.
| + | |
- | | + | |
- | ===Объём стока реки Бойсе===<!---boise-river-near-twin-springs-id.xls--->
| + | |
- | Имеются данные по среднемесячному объёму стока реки Бойсе в районе города Твин Спрингс за каждый месяц с января 1960 по декабрь 2008 года.
| + | |
- | ::Студент 8: предсказать среднемесячный объём стока реки на каждый месяц 2014 года.
| + | |
- | | + | |
- | ===Число убийств и самоубийств в Австралии=== <!---deaths-from-homicides-and-suicid.xls--->
| + | |
- | Измерено среднегодовое число убийств и самоубийств на 100000 населения при помощи огнестрельного оружия и с использованием всех остальных средств в Австралии с 1905 по 2004 годы (имеются пропуски).
| + | |
- | ::Студент 9: смоделировать среднегодовое число убийств, оценить уровни для 2005-2012 годов, построить предсказательный интервал для прогноза.
| + | |
- | ::Студент 10: смоделировать долю среднегодового числа самоубийств, совершаемых при помощи огнестрельного оружия, вреди всех самоубийств. В 1996-1997 годах в Австралии было изменено законодательство в отношении разрешения на хранение и использование огнестрельного оружия, в ходе которой было изъято 600000 единиц оружия (при численности населения в 20000000 человек). Какой эффект это оказало на исследуемый признак?
| + | |
- | | + | |
- | ===Число автомобилей, производимых в Великобритании===<!---ukcars.csv--->
| + | |
- | С первого квартала 1977 по первый квартал 2005 года имеются данные о количестве автомобилей, произведённых в Великобритании, в тысячах штук.
| + | |
- | ::Студент 11: построить прогноз на каждый квартал 2013-2014 года, оценить точность прогноза.
| + | |
- | | + | |
- | ===Средняя номинальная заработная плата в России=== <!---http://sophist.hse.ru/exes/tables/WAG_M.htm--->
| + | |
- | На каждый месяц с января 1993 года рассчитан уровень средней номинальной заработной платы в рублях. Среднемесячная номинальная заработная плата исчисляется исходя из фонда заработной платы работников, деленного на среднесписочную численность работников. В фонд заработной платы включаются начисленные суммы в денежной и натуральной формах за отработанное время и выполненную работу, неотработанное, но оплаченное время (например, ежегодные отпуска), стимулирующие доплаты и надбавки, премии и единовременные поощрения, компенсационные выплаты, связанные с режимом работы и условиями труда.
| + | |
- | ::Студент 12: построить прогноз для уровня средней номинальной заработной платы на каждый месяц до конца 2015 года
| + | |
- | | + | |
- | ===Смертность от сердечно-сосудистых заболеваний=== <!---mort.txt--->
| + | |
- | Имеются данные по средней дневной смертности от сердечно-сосудистых заболеваний в округе Лос-Анджелес в 1970-1979 годах. Собраны данные по пятисот восьми (идущим подряд) неделям, за каждую из этих недель известна также средняя температура воздуха и мера его загрязнённости.
| + | |
- | ::Студент 13: предсказать смертность на следующие 100 недель.
| + | |
- | ::Студент 14: считая для последних 50 недель показатель смертности неизвестным, построить его оценку с учётом температуры и загрязнённости воздуха.
| + | |
- | | + | |
- | ===Солнечная активность=== <!---sunspot.txt--->
| + | |
- | В центре исследования солнечной активности Цюрихской обсерватории собраны данные о среднем числе солнечных пятен за каждый месяц с января 1749 года.
| + | |
- | ::Студент 15: предсказать среднее число солнечных пятен на каждый месяц до конца 2020 года.
| + | |
- | | + | |
- | === Посещаемость сервисов Яндекса ===
| + | |
- | Яндекс измеряет месячную аудиторию сервисов, по наиболее старым из них есть статистика за последние 5-6 лет.
| + | |
- | ::Студент 16: предсказать месячную аудиторию сервиса "Яндекс.Словари" на каждый месяц до конца 2015 года. <!---http://stat.yandex.ru/stats.xml?ProjectID=20&ReportID=-225&Age=m&SMonth=05&FMonth=12&SYear=2008&FYear=2012&SDay=1&FDay=31&alltime=1--->
| + | |
- | ::Студент 17: предсказать месячную аудиторию сервиса "Яндекс.Маркет" на каждый месяц до конца 2015 года. <!---http://stat.yandex.ru/stats.xml?ProjectID=47&ReportID=-225&Age=m&SMonth=05&FMonth=10&SYear=2008&FYear=2013&SDay=1&FDay=31&alltime=1--->
| + | |
- | ::Студент 18: предсказать месячную аудиторию сервиса "Яндекс.Открытки" на каждый месяц до конца 2015 года. <!---http://stat.yandex.ru/stats.xml?ProjectID=95&ReportID=-225&Age=m&SMonth=05&FMonth=02&SYear=2008&FYear=2014&SDay=1&FDay=31&alltime=1--->
| + | |
- | | + | |
- | ===Счета за электроэнергию=== <!---electricity.xls--->
| + | |
- | Имеются помесячные данные о тратах на электроэнергию одного фиксированного домохозяйства на среднем западе США. За каждый месяц 1991-2000 годов приведены затраты на электроэнергию в долларах. Для объяснения колебаний размера счёта приведены следующие переменные: среднемесячная температура по данным последних тридцати лет, погодные индексы CDD и HDD (CDD - Cooling Degree Day - количество градусов, на которые средняя дневная температура больше 65°F, взятое суммой за все дни месяца; HDD - Heating Degree Day - аналогично, суммарное количество градусов, на которое средняя дневная температура меньше 65°F), число проживающих в доме членов семьи, индикатор установки нового счётчика, индикаторы установки двух новых тепловых насосов, объём потребления электроэнергии в киловатт-часах.
| + | |
- | ::Студент 19: предсказать объём потребления и затраты на электроэнергию в каждом месяце 2001 года.
| + | |
- | ::Студент 20: считая неизвестными затраты на электроэнергию в 2000 году, оценить объём потребления электроэнергии, используя исторические данные по потреблению, а также значения температуры, погодных индексов и индикаторов за 2000 год.
| + | |