Участник:Egor Plyashenko/Прогнозирование средней скорости автотранспорта
Материал из MachineLearning.
(21 промежуточная версия не показана) | |||
Строка 1: | Строка 1: | ||
- | В рамках проводимого компанией «Яндекс» конкурса | + | == Постановка задачи == |
- | математика | + | В рамках проводимого компанией «Яндекс» конкурса «[[Интернет-математика|Интернет-математика 2010]]» была предложена задача прогноза скорости движения автомобилей в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания использовалась определенным образом составленная невязка между известными и предсказанными данными, а победитель определялся как получивший минимальное значение невязки. |
- | в Москве на основе имеющихся данных за один месяц. Для оценки качества | + | |
- | + | ||
- | и предсказанными данными, а победитель определялся как получивший минимальное | + | |
- | значение невязки. | + | |
- | + | == Результаты == | |
- | + | ||
- | + | Расчет функционала производится только для вечерних временных промежутков, то есть начиная с 18:00. | |
- | + | ||
- | + | Алгоритм 1 — неизвестная скорость = средней скорости за предыдущие дни в тот же промежуток. | |
- | + | ||
- | + | Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040. | |
- | более | + | |
- | + | Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064. | |
- | + | ||
- | + | ||
- | + | Алгоритм 2 — неизвестная скорость = средней скорости за предыдущие совпадающие дни недели в тот же промежуток. | |
- | + | ||
- | + | Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448. | |
- | + | ||
+ | |||
+ | Алгоритм 3 — за прогнозируемую скорость берется текущая скорость в 18:00(или более ранняя, если наблюдение в данное время отсутствует). | ||
+ | |||
+ | Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957(скорость берется за все дни). | ||
+ | |||
+ | Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 60.2014(скорость берется только за те же дни недели). | ||
+ | |||
+ | == Скорость по дням недели на улице 456880 == | ||
+ | Данная улица обладает наибольшим количеством наблюдений из всех — 6452. После удаления повторяющихся | ||
+ | осталось «всего» 2614 наблюдений. | ||
+ | |||
+ | <gallery> | ||
+ | Изображение:D 3.png| Понедельник | ||
+ | Изображение:D 4.png| Вторник | ||
+ | Изображение:D 5.png| Среда | ||
+ | Изображение:D 6.png| Четверг | ||
+ | Изображение:D 7.png| Пятница | ||
+ | Изображение:D 1.png| Суббота | ||
+ | Изображение:D 2.png| Воскресенье | ||
+ | </gallery> | ||
+ | |||
+ | == Некоторые полезные графики == | ||
+ | По около половине улиц из файла edge_data.txt вообще нет наблюдений. | ||
+ | |||
+ | <gallery> | ||
+ | Изображение:Day Speed.png| Средняя скорость по дням недели | ||
+ | Изображение:Observ num.png| Количество наблюдений по дням недели | ||
+ | Изображение:R1.png| Распределение количества наблюдений по улицам (≥1) | ||
+ | Изображение:R10.png| Распределение количества наблюдений по улицам (≥10) | ||
+ | Изображение:R100.png| Распределение количества наблюдений по улицам (≥100) | ||
+ | Изображение:R1000.png| Распределение количества наблюдений по улицам (≥1000) | ||
+ | </gallery> | ||
+ | |||
+ | == Графики распределения скоростей по величине == | ||
+ | |||
+ | <gallery> | ||
+ | Изображение:1600.png| Время 16:00 | ||
+ | Изображение:1620.png| Время 16:20 | ||
+ | Изображение:1640.png| Время 16:40 | ||
+ | Изображение:1700.png| Время 17:00 | ||
+ | Изображение:1720.png| Время 17:20 | ||
+ | Изображение:1740.png| Время 17:40 | ||
+ | Изображение:1800.png| Время 18:00 | ||
+ | Изображение:1820.png| Время 18:20 | ||
+ | Изображение:1840.png| Время 18:40 | ||
+ | Изображение:1900.png| Время 19:00 | ||
+ | Изображение:1920.png| Время 19:20 | ||
+ | Изображение:1940.png| Время 19:40 | ||
+ | Изображение:2000.png| Время 20:00 | ||
+ | Изображение:2020.png| Время 20:20 | ||
+ | Изображение:2040.png| Время 20:40 | ||
+ | Изображение:2100.png| Время 21:00 | ||
+ | Изображение:2120.png| Время 21:20 | ||
+ | Изображение:2140.png| Время 21:40 | ||
+ | </gallery> |
Текущая версия
Содержание |
Постановка задачи
В рамках проводимого компанией «Яндекс» конкурса «Интернет-математика 2010» была предложена задача прогноза скорости движения автомобилей в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания использовалась определенным образом составленная невязка между известными и предсказанными данными, а победитель определялся как получивший минимальное значение невязки.
Результаты
Расчет функционала производится только для вечерних временных промежутков, то есть начиная с 18:00.
Алгоритм 1 — неизвестная скорость = средней скорости за предыдущие дни в тот же промежуток.
Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040.
Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064.
Алгоритм 2 — неизвестная скорость = средней скорости за предыдущие совпадающие дни недели в тот же промежуток.
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448.
Алгоритм 3 — за прогнозируемую скорость берется текущая скорость в 18:00(или более ранняя, если наблюдение в данное время отсутствует).
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957(скорость берется за все дни).
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 60.2014(скорость берется только за те же дни недели).
Скорость по дням недели на улице 456880
Данная улица обладает наибольшим количеством наблюдений из всех — 6452. После удаления повторяющихся осталось «всего» 2614 наблюдений.
Некоторые полезные графики
По около половине улиц из файла edge_data.txt вообще нет наблюдений.