Участник:Egor Plyashenko/Прогнозирование средней скорости автотранспорта

Материал из MachineLearning.

Перейти к: навигация, поиск

Содержание

Постановка задачи

В рамках проводимого компанией «Яндекс» конкурса «Интернет-математика 2010» была предложена задача прогноза скорости движения автомобилей в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания использовалась определенным образом составленная невязка между известными и предсказанными данными, а победитель определялся как получивший минимальное значение невязки.

Результаты

Расчет функционала производится только для вечерних временных промежутков, т.е. начиная с 18:00.

Алгоритм 1 - неизвестная скорость = средней скорости за предыдущие дни в тот же промежуток.

Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040.

Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064.


Алгоритм 2 - неизвестная скорость = средней скорости за предыдущие совпадающие дни недели в тот же промежуток.

Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448.


Алгоритм 3 - за прогнозируемую скорость берется текущая скорость в 18:00(или более поздняя, если наблюдение в данное время отсутствует).

Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957(скорость берется за все дни).

Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 60.2014(скорость берется только за те же дни недели).

Скорость по дням недели на улице 456880

Данная улица обладает наибольшим количеством наблюдений из всех - 6452. После удаления повторяющихся осталось "всего" 2614 наблюдений.

Некоторые полезные графики

По около половине улиц из файла edge_data.txt вообще нет наблюдений.


Графики распределения скоростей по величине

Личные инструменты