Участник:Egor Plyashenko/Прогнозирование средней скорости автотранспорта

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 2: Строка 2:
В рамках проводимого компанией «Яндекс» конкурса «Интернет-
В рамках проводимого компанией «Яндекс» конкурса «Интернет-
математика 2010» была предложена задача прогноза скорости движения автомобилей
математика 2010» была предложена задача прогноза скорости движения автомобилей
-
в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказа-
+
в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания
-
ния использовалась определенным образом составленная невязка между известными
+
использовалась определенным образом составленная невязка между известными
и предсказанными данными, а победитель определялся как получивший минимальное
и предсказанными данными, а победитель определялся как получивший минимальное
значение невязки.
значение невязки.
-
== Дневник исследователя ==
+
== Результаты ==
-
Done:
+
-
* Осуществил загрузку данных в MatLab. Из-за большого размера пришлось написать программу, разбивающую файл jams.txt на 10 частей для удобства работы с ним.
+
-
* Построил некоторые важные графики: средняя скорость по дням месяца, скорость в течение каждого дня недели и т. д..
+
-
* Реализовал простейший алгоритм - скорость в неизвестный день = средней скорости за предыдущие дни (очень долго считается, даже при выполненной оптимизации!!!).
+
 +
Расчет функционала производится только для вечерних временных промежутков, т.е. начиная с 18:00.
 +
Алгоритм 1 - неизвестная скорость = средней скорости за предыдущие дни в тот же промежуток.
 +
Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040.
 +
Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064.
-
Результаты:
 
-
1)Алгоритм - среднее по все дням в данное время. Значения функционала при прогнозировании скорости в 30-й день(воскресенье):
+
Алгоритм 2 - неизвестная скорость = средней скорости за предыдущие совпадающие дни недели в тот же промежуток.
-
Q = 69.4040.
+
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448.
-
2)Алгоритм - среднее по все дням в данное время. Значения функционала при прогнозировании скорости в 28-й день(пятница):
+
Алгоритм 3 - за прогнозируемую скорость берется текущая скорость в 18:00(или более поздняя, если наблюдение в данное время отсутствует).
-
Q = считается.
+
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957.
-
 
+
-
3)Алгоритм - среднее по все таким же дням недели в данное время. Значения функционала при прогнозировании скорости в 30-й день(воскресенье):
+
-
Q = 64.2448.
+
-
 
+
-
4)Алгоритм - 18:00 далее константа. Значения функционала при прогнозировании скорости в 30-й день(воскресенье):
+
-
Q = считается.
+
== Скорость по дням недели на улице 456880==
== Скорость по дням недели на улице 456880==
 +
Данная улица обладает наибольшим количеством наблюдений из всех - 6452. После удаления повторяющихся
 +
осталось "всего" 2614 наблюдений.
 +
<gallery>
<gallery>
Изображение:D 3.png| Понедельник
Изображение:D 3.png| Понедельник
Строка 41: Строка 37:
== Некоторые полезные графики==
== Некоторые полезные графики==
 +
По около половине улиц из файла edge_data.txt вообще нет наблюдений.
 +
<gallery>
<gallery>

Версия 15:00, 9 апреля 2011

Содержание

Постановка задачи

В рамках проводимого компанией «Яндекс» конкурса «Интернет- математика 2010» была предложена задача прогноза скорости движения автомобилей в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания использовалась определенным образом составленная невязка между известными и предсказанными данными, а победитель определялся как получивший минимальное значение невязки.

Результаты

Расчет функционала производится только для вечерних временных промежутков, т.е. начиная с 18:00.

Алгоритм 1 - неизвестная скорость = средней скорости за предыдущие дни в тот же промежуток. Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040. Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064.


Алгоритм 2 - неизвестная скорость = средней скорости за предыдущие совпадающие дни недели в тот же промежуток. Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448.

Алгоритм 3 - за прогнозируемую скорость берется текущая скорость в 18:00(или более поздняя, если наблюдение в данное время отсутствует). Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957.

Скорость по дням недели на улице 456880

Данная улица обладает наибольшим количеством наблюдений из всех - 6452. После удаления повторяющихся осталось "всего" 2614 наблюдений.

Некоторые полезные графики

По около половине улиц из файла edge_data.txt вообще нет наблюдений.


Графики распределения скоростей по величине

Личные инструменты