Участник:Egor Plyashenko/Прогнозирование средней скорости автотранспорта

Материал из MachineLearning.

< Участник:Egor Plyashenko(Различия между версиями)
Перейти к: навигация, поиск
 
(12 промежуточных версий не показаны.)
Строка 1: Строка 1:
== Постановка задачи ==
== Постановка задачи ==
-
В рамках проводимого компанией «Яндекс» конкурса «Интернет-
+
В рамках проводимого компанией «Яндекс» конкурса «[[Интернет-математика|Интернет-математика 2010]]» была предложена задача прогноза скорости движения автомобилей в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания использовалась определенным образом составленная невязка между известными и предсказанными данными, а победитель определялся как получивший минимальное значение невязки.
-
математика 2010» была предложена задача прогноза скорости движения автомобилей
+
-
в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказа-
+
-
ния использовалась определенным образом составленная невязка между известными
+
-
и предсказанными данными, а победитель определялся как получивший минимальное
+
-
значение невязки.
+
-
== Дневник исследователя ==
+
== Результаты ==
-
Done:
+
-
* Осуществил загрузку данных в MatLab. Из-за большого размера пришлось написать программу, разбивающую файл jams.txt на 10 частей для удобства работы с ним.
+
-
* Построил некоторые важные графики: средняя скорость по дням месяца, скорость в течение каждого дня недели и т. д..
+
-
* Реализовал простейший алгоритм - скорость в неизвестный день = средней скорости за предыдущие дни (очень долго считается, даже при выполненной оптимизации!!!).
+
 +
Расчет функционала производится только для вечерних временных промежутков, то есть начиная с 18:00.
 +
Алгоритм 1 — неизвестная скорость = средней скорости за предыдущие дни в тот же промежуток.
-
Результаты:
+
Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040.
-
1)Алгоритм - среднее по все дням в данное время. Значения функционала при прогнозировании скорости в 30-й день(воскресенье):
+
Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064.
-
Q = 69.4040.
+
-
2)Алгоритм - среднее по все дням в данное время. Значения функционала при прогнозировании скорости в 28-й день(пятница):
 
-
Q = считается.
 
-
3)Алгоритм - среднее по все таким же дням недели в данное время. Значения функционала при прогнозировании скорости в 30-й день(воскресенье):
+
Алгоритм 2 — неизвестная скорость = средней скорости за предыдущие совпадающие дни недели в тот же промежуток.
-
Q = 64.2448.
+
-
4)Алгоритм - 18:00 далее константа. Значения функционала при прогнозировании скорости в 30-й день(воскресенье):
+
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448.
-
Q = считается.
+
-
==== Графики ====
+
 
 +
Алгоритм 3 — за прогнозируемую скорость берется текущая скорость в 18:00(или более ранняя, если наблюдение в данное время отсутствует).
 +
 
 +
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957(скорость берется за все дни).
 +
 
 +
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 60.2014(скорость берется только за те же дни недели).
 +
 
 +
== Скорость по дням недели на улице 456880 ==
 +
Данная улица обладает наибольшим количеством наблюдений из всех — 6452. После удаления повторяющихся
 +
осталось «всего» 2614 наблюдений.
 +
 
 +
<gallery>
 +
Изображение:D 3.png| Понедельник
 +
Изображение:D 4.png| Вторник
 +
Изображение:D 5.png| Среда
 +
Изображение:D 6.png| Четверг
 +
Изображение:D 7.png| Пятница
 +
Изображение:D 1.png| Суббота
 +
Изображение:D 2.png| Воскресенье
 +
</gallery>
 +
 
 +
== Некоторые полезные графики ==
 +
По около половине улиц из файла edge_data.txt вообще нет наблюдений.
 +
 
 +
<gallery>
 +
Изображение:Day Speed.png| Средняя скорость по дням недели
 +
Изображение:Observ num.png| Количество наблюдений по дням недели
 +
Изображение:R1.png| Распределение количества наблюдений по улицам (≥1)
 +
Изображение:R10.png| Распределение количества наблюдений по улицам (≥10)
 +
Изображение:R100.png| Распределение количества наблюдений по улицам (≥100)
 +
Изображение:R1000.png| Распределение количества наблюдений по улицам (≥1000)
 +
</gallery>
 +
 
 +
== Графики распределения скоростей по величине ==
<gallery>
<gallery>
Строка 36: Строка 57:
Изображение:1640.png| Время 16:40
Изображение:1640.png| Время 16:40
Изображение:1700.png| Время 17:00
Изображение:1700.png| Время 17:00
-
Изображение:1700.png| Время 17:20
+
Изображение:1720.png| Время 17:20
-
Изображение:1700.png| Время 17:40
+
Изображение:1740.png| Время 17:40
-
Изображение:1700.png| Время 18:00
+
Изображение:1800.png| Время 18:00
-
Изображение:1700.png| Время 18:20
+
Изображение:1820.png| Время 18:20
-
Изображение:1700.png| Время 18:40
+
Изображение:1840.png| Время 18:40
-
Изображение:1700.png| Время 19:00
+
Изображение:1900.png| Время 19:00
-
Изображение:1700.png| Время 19:20
+
Изображение:1920.png| Время 19:20
-
Изображение:1700.png| Время 19:40
+
Изображение:1940.png| Время 19:40
-
Изображение:1700.png| Время 20:00
+
Изображение:2000.png| Время 20:00
-
Изображение:1700.png| Время 20:20
+
Изображение:2020.png| Время 20:20
-
Изображение:1700.png| Время 20:40
+
Изображение:2040.png| Время 20:40
-
Изображение:1700.png| Время 21:00
+
Изображение:2100.png| Время 21:00
-
Изображение:1700.png| Время 21:20
+
Изображение:2120.png| Время 21:20
-
Изображение:1700.png| Время 21:40
+
Изображение:2140.png| Время 21:40
</gallery>
</gallery>

Текущая версия

Содержание

Постановка задачи

В рамках проводимого компанией «Яндекс» конкурса «Интернет-математика 2010» была предложена задача прогноза скорости движения автомобилей в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания использовалась определенным образом составленная невязка между известными и предсказанными данными, а победитель определялся как получивший минимальное значение невязки.

Результаты

Расчет функционала производится только для вечерних временных промежутков, то есть начиная с 18:00.

Алгоритм 1 — неизвестная скорость = средней скорости за предыдущие дни в тот же промежуток.

Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040.

Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064.


Алгоритм 2 — неизвестная скорость = средней скорости за предыдущие совпадающие дни недели в тот же промежуток.

Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448.


Алгоритм 3 — за прогнозируемую скорость берется текущая скорость в 18:00(или более ранняя, если наблюдение в данное время отсутствует).

Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957(скорость берется за все дни).

Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 60.2014(скорость берется только за те же дни недели).

Скорость по дням недели на улице 456880

Данная улица обладает наибольшим количеством наблюдений из всех — 6452. После удаления повторяющихся осталось «всего» 2614 наблюдений.

Некоторые полезные графики

По около половине улиц из файла edge_data.txt вообще нет наблюдений.

Графики распределения скоростей по величине

Личные инструменты