Прогнозирование объемов продаж новых товаров (отчет)
Материал из MachineLearning.
(→Математическое описание) |
(→Математическое описание) |
||
Строка 65: | Строка 65: | ||
<tex>y_{i}=x'_{i}b+u_{i}</tex>, <tex> Quant_{i}(y_{i}|x_{i})=x'_{i}b</tex> (1) | <tex>y_{i}=x'_{i}b+u_{i}</tex>, <tex> Quant_{i}(y_{i}|x_{i})=x'_{i}b</tex> (1) | ||
</center> | </center> | ||
+ | |||
+ | Где Quant(<tex>y_{i} | x_{i}</tex>) обозначает условную квантиль <tex>y_{i}</tex> на векторе регрессора <tex>x_{i}</tex>. Нужно отметить, что здесь предполагается, что и <tex>x_{i}</tex>, и <tex>y_{i}</tex> наблюдаются без ошибки, и что уравнение (1) правильно определено. Такие проблемы, как ошибки измерения и пропущенные переменные здесь не рассматриваются. | ||
+ | Если (1) определено некорректно (то есть, не линейно), тогда модель можно | ||
+ | рассматривать как лучший линейный прогноз для условной квантили. | ||
+ | Если функция <tex>F_{u}</tex>(⋅) известна, то для оценки b могут использоваться различ- | ||
+ | ные подходы. Однако в данной модели распределение остаточного члена <tex>u_{i}</tex> | ||
+ | остается неопределенным. Как показывает соотношение (1), единственным | ||
+ | предположением является лишь то, что uθi удовлетворяет ограничению на | ||
+ | квантиль: | ||
== Описание системы == | == Описание системы == | ||
* Ссылка на файл system.docs | * Ссылка на файл system.docs | ||
* Ссылка на файлы системы | * Ссылка на файлы системы |
Версия 17:24, 9 марта 2010
Введение в проект
Описание проекта
Цель проекта
Цель проекта - прогнозирование еженедельных продаж новых товаров.
Обоснование проекта
Результаты проекта могут быть использованы для планирования объёмов продаж новых товаров.
Описание данных
Дано: товарный классификатор (иерархия товарных групп); региональный классификатор (иерархия магазинов и регионов); товародвижения (продажи, поставки, остатки и пр., праздники и промо-акции).
Критерии качества
Продажи прогнозируется по каждому товару раздельно. Прогнозирование объёмов продаж на неделю основывается на предыстории продаж за фиксированное число дней. Это число дней регулируется переменной stp (количество шагов - количество дней, на которых основывается прогноз). Критерием качества служит сумма модулей отклонения прогноза от реальной величины покупок по дням.
Требования к проекту
Сумма модулей отклонения в алгоритме проекта должна быль меньше, чем для скользящего среднего за 30 дней.
Выполнимость проекта
Прогнозирование объёмов продаж новых товаров производится в будние дни (время праздников и промо-акций в проекте не рассматривается).
Используемые методы
Прогнозирование производится методом квантильной регрессии для различных квантилей Θ (0.25; 0.4; 0.5; 0.6; 0.75). При прогнозировании можно менять параметр stp.
Постановка задачи
На основе данных продаж за фиксированное число дней (параметр stp) прогнозируются продажи новых товаров на 7 дней вперёд с наибольшей вероятностью (Θ=0.5) и вероятностями 25%, 40%. Будем использовать функционал качества
где y, соответственно известное значение и прогноз.
- временной ряд для каждого из товаров, - значение продаж для каждого такого ряда.
Описание алгоритмов
В проекте использовался метод квантильной регрессии.
Обзор литературы
Для прогнозирования объёмов продаж новых товаров в литературе описываются различные методы. Метод квантильной регрессии впервые применён в [1], прогнозирование с помощью которого наиболее точно и позволяет прогнозировать c разными вероятностями [2]. Квантильная регрессия с параметром 0.5 является линейной, которая рассматриватся в [4].
Базовые предположения
Предполагается, что наилучший прогноз будет получен с помощью квантильной регрессии с параметром Θ=0.5. Прогноз требуется не более чем на 7 дней.
Математическое описание
Общая модель квантильной регрессии
Пусть , i=1,...,n - некоторые переменные, где - K×1 вектор независимых переменных в уравнении регрессии. Допускается, что
≤τ | )=(τ- b| ), i=1,...,n.
Это соотношение — в другой формулировке — может быть переписано как
, (1)
Где Quant() обозначает условную квантиль на векторе регрессора . Нужно отметить, что здесь предполагается, что и , и наблюдаются без ошибки, и что уравнение (1) правильно определено. Такие проблемы, как ошибки измерения и пропущенные переменные здесь не рассматриваются. Если (1) определено некорректно (то есть, не линейно), тогда модель можно рассматривать как лучший линейный прогноз для условной квантили. Если функция (⋅) известна, то для оценки b могут использоваться различ- ные подходы. Однако в данной модели распределение остаточного члена остается неопределенным. Как показывает соотношение (1), единственным предположением является лишь то, что uθi удовлетворяет ограничению на квантиль:
Описание системы
- Ссылка на файл system.docs
- Ссылка на файлы системы