Прогнозирование объемов продаж групп товаров (отчет)
Материал из MachineLearning.
м (→Требования к проекту) |
(→Базовые предположения) |
||
Строка 67: | Строка 67: | ||
=== Базовые предположения === | === Базовые предположения === | ||
+ | Будем предполагать, что вероятности продажи товаров из одной группы нижнего уровня | ||
+ | (т.е. группы, в которую входят только товары, а не другие группы) | ||
+ | во всех магазинах имеют одинаковое распределение. Таким образом, оценив это распределение, | ||
+ | а также суммарные продажи всех товаров из группы нижнего уровня в некотором магазине (например, | ||
+ | с помощью скользящего среднего), можно будет спрогнозировать продажи отдельных товаров точнее, | ||
+ | чем используя базовый алгоритм (скользящее среднее по каждому товару). | ||
+ | Также предполагается, что прогноз можно делать по отдельности для каждого из магазинов. | ||
=== Математическое описание === | === Математическое описание === |
Версия 15:53, 6 февраля 2010
Введение в проект
Описание проекта
Цель проекта
Цель проекта — прогнозирование еженедельных покупок товаров. Горизонт прогнозирования — одна неделя.
Обоснование проекта
Полученные результаты могут быть использованы для планирования закупок товаров магазинами.
Описание данных
Дан региональный классификатор магазинов, товарный классификатор, ряды продаж по SKU (stock keeping unit), информация о дефиците товара, список праздничных дней, разметка промо-акций для каждого товара и розничные цены на товары.
Критерии качества
Используется скользящий контроль — прогноз закупок товаров, сделанный исходя из данных на некотором начальном временном интервале, сравнивается с реальными продажами. Критерием качества служит сумма модулей отклонений прогноза от реальной величины закупок либо сумма квадратов отклонений.
Требования к проекту
Сумма модулей (либо квадратов) отклонений для разработанного алгоритма должен быть меньше, чем для базового алгоритма — скользящего среднего за предыдущий месяц.
Выполнимость проекта
Прогнозирование покупок товаров в празничные дни и во время промо-акций является отдельной задачей и в данном проекте не рассматривается.
Используемые методы
Предполагается, что товары могут быть агрегированы в группы, исходя из их цены и «близости» по товарному классификатору. Затем может быть осуществлен прогноз для получившихся групп товаров и «разбрасывание» результатов прогнозирования по отдельным товарам из групп.
Постановка задачи
Заданы временные ряды продаж товаров — продажи -ого товара в -ом магазине за день (, — множество товаров; , — множество магазинов; — натуральное число), причем значения продаж известны при . Также задан товарный классификатор, исходя из которого товары разбиваются на группы, образующие иерархическую стуктуру (например, какой-то товар может входить в группу «ЖК-телевизоры 15"», которая входит в «ЖК-телевизоры 10" - 17"» и далее в «ЖК-телевизоры», «Телевизоры» и «Бытовую технику»). Требуется для всех товаров и всех магазинов спрогнозировать продажи за неделю, следующую после , то есть значение величины
Для оценки качества прогнозов будем использовать скользящий контроль, помещая в обучающую выборку значения при , . Как функционал качества будем использовать
или
Описание алгоритмов
Обзор литературы
Базовые предположения
Будем предполагать, что вероятности продажи товаров из одной группы нижнего уровня (т.е. группы, в которую входят только товары, а не другие группы) во всех магазинах имеют одинаковое распределение. Таким образом, оценив это распределение, а также суммарные продажи всех товаров из группы нижнего уровня в некотором магазине (например, с помощью скользящего среднего), можно будет спрогнозировать продажи отдельных товаров точнее, чем используя базовый алгоритм (скользящее среднее по каждому товару). Также предполагается, что прогноз можно делать по отдельности для каждого из магазинов.
Математическое описание
Варианты или модификации
Описание системы
- Ссылка на файл system.docs
- Ссылка на файлы системы
Отчет о вычислительных экспериментах
Визуальный анализ работы алгоритма
Анализ качества работы алгоритма
Анализ зависимости работы алгоритма от параметров
Отчет о полученных результатах
Список литературы
Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |