Участник:Egor Plyashenko/Прогнозирование средней скорости автотранспорта

Материал из MachineLearning.

< Участник:Egor Plyashenko(Различия между версиями)
Перейти к: навигация, поиск
 
(21 промежуточная версия не показана)
Строка 1: Строка 1:
-
В рамках проводимого компанией «Яндекс» конкурса «Интернет-
+
== Постановка задачи ==
-
математика 2010» была предложена задача прогноза скорости движения автомобилей
+
В рамках проводимого компанией «Яндекс» конкурса «[[Интернет-математика|Интернет-математика 2010]]» была предложена задача прогноза скорости движения автомобилей в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания использовалась определенным образом составленная невязка между известными и предсказанными данными, а победитель определялся как получивший минимальное значение невязки.
-
в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказа-
+
-
ния использовалась определенным образом составленная невязка между известными
+
-
и предсказанными данными, а победитель определялся как получивший минимальное
+
-
значение невязки.
+
-
Рассматривается задача прогноза скорости движения автомобилей
+
== Результаты ==
-
по улицам города, если известны только данные о скорости за
+
 
-
предыдущий месяц и граф дорог. Данная задача была поставлена
+
Расчет функционала производится только для вечерних временных промежутков, то есть начиная с 18:00.
-
на конкурсе «Интернет математика 2010», проводимом компанией
+
 
-
Яндекс. Количество машин или их плотность неизвестны.
+
Алгоритм 1 — неизвестная скорость = средней скорости за предыдущие дни в тот же промежуток.
-
Данные о скорости автомобилей зачастую являются нерегулярными,
+
 
-
на большинстве улиц имеются пробелы в данных величиной
+
Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040.
-
более получаса, а в некоторые дни данных нет вовсе. В некоторых
+
 
-
случаях имеются противоречащие друг другу данные. Недостающую
+
Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064.
-
информацию можно почерпнуть с соседних улиц, благо граф дорог
+
 
-
города учитывает правила дорожного движения (запрещенные
+
 
-
повороты и проезды). Задача предсказания усложняется наличием
+
Алгоритм 2 — неизвестная скорость = средней скорости за предыдущие совпадающие дни недели в тот же промежуток.
-
некоторой хаотичности в данных, а также, по всей видимости, ошибок
+
 
-
связанных с определением улицы по полученным от автомобильных
+
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448.
-
GPS-навигаторов координатам.
+
 
 +
 
 +
Алгоритм 3 — за прогнозируемую скорость берется текущая скорость в 18:00(или более ранняя, если наблюдение в данное время отсутствует).
 +
 
 +
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957(скорость берется за все дни).
 +
 
 +
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 60.2014(скорость берется только за те же дни недели).
 +
 
 +
== Скорость по дням недели на улице 456880 ==
 +
Данная улица обладает наибольшим количеством наблюдений из всех — 6452. После удаления повторяющихся
 +
осталось «всего» 2614 наблюдений.
 +
 
 +
<gallery>
 +
Изображение:D 3.png| Понедельник
 +
Изображение:D 4.png| Вторник
 +
Изображение:D 5.png| Среда
 +
Изображение:D 6.png| Четверг
 +
Изображение:D 7.png| Пятница
 +
Изображение:D 1.png| Суббота
 +
Изображение:D 2.png| Воскресенье
 +
</gallery>
 +
 
 +
== Некоторые полезные графики ==
 +
По около половине улиц из файла edge_data.txt вообще нет наблюдений.
 +
 
 +
<gallery>
 +
Изображение:Day Speed.png| Средняя скорость по дням недели
 +
Изображение:Observ num.png| Количество наблюдений по дням недели
 +
Изображение:R1.png| Распределение количества наблюдений по улицам (≥1)
 +
Изображение:R10.png| Распределение количества наблюдений по улицам (≥10)
 +
Изображение:R100.png| Распределение количества наблюдений по улицам (≥100)
 +
Изображение:R1000.png| Распределение количества наблюдений по улицам (≥1000)
 +
</gallery>
 +
 
 +
== Графики распределения скоростей по величине ==
 +
 
 +
<gallery>
 +
Изображение:1600.png| Время 16:00
 +
Изображение:1620.png| Время 16:20
 +
Изображение:1640.png| Время 16:40
 +
Изображение:1700.png| Время 17:00
 +
Изображение:1720.png| Время 17:20
 +
Изображение:1740.png| Время 17:40
 +
Изображение:1800.png| Время 18:00
 +
Изображение:1820.png| Время 18:20
 +
Изображение:1840.png| Время 18:40
 +
Изображение:1900.png| Время 19:00
 +
Изображение:1920.png| Время 19:20
 +
Изображение:1940.png| Время 19:40
 +
Изображение:2000.png| Время 20:00
 +
Изображение:2020.png| Время 20:20
 +
Изображение:2040.png| Время 20:40
 +
Изображение:2100.png| Время 21:00
 +
Изображение:2120.png| Время 21:20
 +
Изображение:2140.png| Время 21:40
 +
</gallery>

Текущая версия

Содержание

Постановка задачи

В рамках проводимого компанией «Яндекс» конкурса «Интернет-математика 2010» была предложена задача прогноза скорости движения автомобилей в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания использовалась определенным образом составленная невязка между известными и предсказанными данными, а победитель определялся как получивший минимальное значение невязки.

Результаты

Расчет функционала производится только для вечерних временных промежутков, то есть начиная с 18:00.

Алгоритм 1 — неизвестная скорость = средней скорости за предыдущие дни в тот же промежуток.

Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040.

Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064.


Алгоритм 2 — неизвестная скорость = средней скорости за предыдущие совпадающие дни недели в тот же промежуток.

Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448.


Алгоритм 3 — за прогнозируемую скорость берется текущая скорость в 18:00(или более ранняя, если наблюдение в данное время отсутствует).

Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957(скорость берется за все дни).

Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 60.2014(скорость берется только за те же дни недели).

Скорость по дням недели на улице 456880

Данная улица обладает наибольшим количеством наблюдений из всех — 6452. После удаления повторяющихся осталось «всего» 2614 наблюдений.

Некоторые полезные графики

По около половине улиц из файла edge_data.txt вообще нет наблюдений.

Графики распределения скоростей по величине

Личные инструменты