Участник:Egor Plyashenko/Прогнозирование средней скорости автотранспорта

Материал из MachineLearning.

< Участник:Egor Plyashenko(Различия между версиями)
Перейти к: навигация, поиск
 
(4 промежуточные версии не показаны)
Строка 1: Строка 1:
== Постановка задачи ==
== Постановка задачи ==
-
В рамках проводимого компанией «Яндекс» конкурса «Интернет-
+
В рамках проводимого компанией «Яндекс» конкурса «[[Интернет-математика|Интернет-математика 2010]]» была предложена задача прогноза скорости движения автомобилей в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания использовалась определенным образом составленная невязка между известными и предсказанными данными, а победитель определялся как получивший минимальное значение невязки.
-
математика 2010» была предложена задача прогноза скорости движения автомобилей
+
-
в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания
+
-
использовалась определенным образом составленная невязка между известными
+
-
и предсказанными данными, а победитель определялся как получивший минимальное
+
-
значение невязки.
+
== Результаты ==
== Результаты ==
-
Расчет функционала производится только для вечерних временных промежутков, т.е. начиная с 18:00.
+
Расчет функционала производится только для вечерних временных промежутков, то есть начиная с 18:00.
 +
 
 +
Алгоритм 1 — неизвестная скорость = средней скорости за предыдущие дни в тот же промежуток.
-
Алгоритм 1 - неизвестная скорость = средней скорости за предыдущие дни в тот же промежуток.
 
Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040.
Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040.
 +
Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064.
Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064.
-
Алгоритм 2 - неизвестная скорость = средней скорости за предыдущие совпадающие дни недели в тот же промежуток.
+
Алгоритм 2 — неизвестная скорость = средней скорости за предыдущие совпадающие дни недели в тот же промежуток.
 +
 
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448.
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448.
-
Алгоритм 3 - за прогнозируемую скорость берется текущая скорость в 18:00(или более поздняя, если наблюдение в данное время отсутствует).
+
 
 +
Алгоритм 3 — за прогнозируемую скорость берется текущая скорость в 18:00(или более ранняя, если наблюдение в данное время отсутствует).
 +
 
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957(скорость берется за все дни).
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957(скорость берется за все дни).
 +
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 60.2014(скорость берется только за те же дни недели).
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 60.2014(скорость берется только за те же дни недели).
-
== Скорость по дням недели на улице 456880==
+
== Скорость по дням недели на улице 456880 ==
-
Данная улица обладает наибольшим количеством наблюдений из всех - 6452. После удаления повторяющихся
+
Данная улица обладает наибольшим количеством наблюдений из всех — 6452. После удаления повторяющихся
-
осталось "всего" 2614 наблюдений.
+
осталось «всего» 2614 наблюдений.
<gallery>
<gallery>
Строка 37: Строка 38:
</gallery>
</gallery>
-
== Некоторые полезные графики==
+
== Некоторые полезные графики ==
-
По около половине улиц из файла edge_data.txt вообще нет наблюдений.
+
По около половине улиц из файла edge_data.txt вообще нет наблюдений.
-
 
+
<gallery>
<gallery>
Строка 50: Строка 50:
</gallery>
</gallery>
-
== Графики распределения скоростей по величине==
+
== Графики распределения скоростей по величине ==
<gallery>
<gallery>

Текущая версия

Содержание

Постановка задачи

В рамках проводимого компанией «Яндекс» конкурса «Интернет-математика 2010» была предложена задача прогноза скорости движения автомобилей в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания использовалась определенным образом составленная невязка между известными и предсказанными данными, а победитель определялся как получивший минимальное значение невязки.

Результаты

Расчет функционала производится только для вечерних временных промежутков, то есть начиная с 18:00.

Алгоритм 1 — неизвестная скорость = средней скорости за предыдущие дни в тот же промежуток.

Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040.

Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064.


Алгоритм 2 — неизвестная скорость = средней скорости за предыдущие совпадающие дни недели в тот же промежуток.

Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448.


Алгоритм 3 — за прогнозируемую скорость берется текущая скорость в 18:00(или более ранняя, если наблюдение в данное время отсутствует).

Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957(скорость берется за все дни).

Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 60.2014(скорость берется только за те же дни недели).

Скорость по дням недели на улице 456880

Данная улица обладает наибольшим количеством наблюдений из всех — 6452. После удаления повторяющихся осталось «всего» 2614 наблюдений.

Некоторые полезные графики

По около половине улиц из файла edge_data.txt вообще нет наблюдений.

Графики распределения скоростей по величине

Личные инструменты