Участник:Egor Plyashenko/Прогнозирование средней скорости автотранспорта
Материал из MachineLearning.
(4 промежуточные версии не показаны) | |||
Строка 1: | Строка 1: | ||
== Постановка задачи == | == Постановка задачи == | ||
- | В рамках проводимого компанией «Яндекс» конкурса | + | В рамках проводимого компанией «Яндекс» конкурса «[[Интернет-математика|Интернет-математика 2010]]» была предложена задача прогноза скорости движения автомобилей в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания использовалась определенным образом составленная невязка между известными и предсказанными данными, а победитель определялся как получивший минимальное значение невязки. |
- | математика | + | |
- | в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания | + | |
- | использовалась определенным образом составленная невязка между известными | + | |
- | и предсказанными данными, а победитель определялся как получивший минимальное | + | |
- | значение невязки. | + | |
== Результаты == | == Результаты == | ||
- | Расчет функционала производится только для вечерних временных промежутков, | + | Расчет функционала производится только для вечерних временных промежутков, то есть начиная с 18:00. |
+ | |||
+ | Алгоритм 1 — неизвестная скорость = средней скорости за предыдущие дни в тот же промежуток. | ||
- | |||
Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040. | Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040. | ||
+ | |||
Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064. | Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064. | ||
- | Алгоритм | + | Алгоритм 2 — неизвестная скорость = средней скорости за предыдущие совпадающие дни недели в тот же промежуток. |
+ | |||
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448. | Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448. | ||
- | Алгоритм | + | |
+ | Алгоритм 3 — за прогнозируемую скорость берется текущая скорость в 18:00(или более ранняя, если наблюдение в данное время отсутствует). | ||
+ | |||
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957(скорость берется за все дни). | Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957(скорость берется за все дни). | ||
+ | |||
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 60.2014(скорость берется только за те же дни недели). | Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 60.2014(скорость берется только за те же дни недели). | ||
- | == Скорость по дням недели на улице 456880== | + | == Скорость по дням недели на улице 456880 == |
- | Данная улица обладает наибольшим количеством наблюдений из | + | Данная улица обладает наибольшим количеством наблюдений из всех — 6452. После удаления повторяющихся |
- | осталось | + | осталось «всего» 2614 наблюдений. |
<gallery> | <gallery> | ||
Строка 37: | Строка 38: | ||
</gallery> | </gallery> | ||
- | == Некоторые полезные графики== | + | == Некоторые полезные графики == |
- | По около половине улиц из файла edge_data.txt вообще нет наблюдений. | + | По около половине улиц из файла edge_data.txt вообще нет наблюдений. |
- | + | ||
<gallery> | <gallery> | ||
Строка 50: | Строка 50: | ||
</gallery> | </gallery> | ||
- | == Графики распределения скоростей по величине== | + | == Графики распределения скоростей по величине == |
<gallery> | <gallery> |
Текущая версия
Содержание |
Постановка задачи
В рамках проводимого компанией «Яндекс» конкурса «Интернет-математика 2010» была предложена задача прогноза скорости движения автомобилей в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания использовалась определенным образом составленная невязка между известными и предсказанными данными, а победитель определялся как получивший минимальное значение невязки.
Результаты
Расчет функционала производится только для вечерних временных промежутков, то есть начиная с 18:00.
Алгоритм 1 — неизвестная скорость = средней скорости за предыдущие дни в тот же промежуток.
Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040.
Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064.
Алгоритм 2 — неизвестная скорость = средней скорости за предыдущие совпадающие дни недели в тот же промежуток.
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448.
Алгоритм 3 — за прогнозируемую скорость берется текущая скорость в 18:00(или более ранняя, если наблюдение в данное время отсутствует).
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957(скорость берется за все дни).
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 60.2014(скорость берется только за те же дни недели).
Скорость по дням недели на улице 456880
Данная улица обладает наибольшим количеством наблюдений из всех — 6452. После удаления повторяющихся осталось «всего» 2614 наблюдений.
Некоторые полезные графики
По около половине улиц из файла edge_data.txt вообще нет наблюдений.