Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 874, весна 2011
Материал из MachineLearning.
(→Задача 8: Локальные методы прогнозирования, поиск инвариантного преобразования (пример)) |
|||
Строка 1: | Строка 1: | ||
+ | {{Main|Численные методы обучения по прецедентам (практика, В.В. Стрижов)}} | ||
+ | |||
+ | - | ||
+ | __NOTOC__ | ||
+ | |||
+ | - | ||
+ | |||
+ | - | ||
+ | Перед выполнением заданий рекомендуются к прочтению | ||
+ | |||
+ | - | ||
+ | * [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)|Численные методы обучения по прецедентам]] | ||
+ | |||
+ | - | ||
+ | * [[Отчет о выполнении исследовательского проекта (практика, В.В. Стрижов)|Отчет о выполнении исследовательского проекта]] | ||
+ | |||
+ | - | ||
+ | * [[Автоматизация и стандартизация научных исследований (практика, В.В. Стрижов)|Автоматизация и стандартизация научных исследований]] | ||
+ | |||
+ | - | ||
+ | |||
+ | - | ||
+ | == Задачи == | ||
+ | |||
+ | - | ||
+ | {| class="wikitable" | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | ! Название задачи | ||
+ | |||
+ | - | ||
+ | ! Работу выполняет | ||
+ | |||
+ | - | ||
+ | ! Работу рецензирует | ||
+ | |||
+ | - | ||
+ | ! Комментарии | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | | [[Прогнозирование с использованием теста Гренжера (пример)]] | ||
+ | |||
+ | - | ||
+ | | Анастасия Мотренко | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | | [[Выбор функции активации при прогнозировании нейронными сетями (пример)]] | ||
+ | |||
+ | - | ||
+ | | Георгий Рудой | ||
+ | |||
+ | - | ||
+ | | Николай Балдин | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | | [[Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)]] | ||
+ | |||
+ | - | ||
+ | | Любовь Леонтьева | ||
+ | |||
+ | - | ||
+ | | Михаил Бурмистров | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | | [[Прогнозирование функциями дискретного аргумента (пример)]] | ||
+ | |||
+ | - | ||
+ | | Егор Будников | ||
+ | |||
+ | - | ||
+ | | Александр Романенко | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | | [[Исследование сходимости при прогнозировании нейронными сетями с обратной связью (пример)]] | ||
+ | |||
+ | - | ||
+ | | Николай Балдин | ||
+ | |||
+ | - | ||
+ | | Георгий Рудой | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | | [[Непараметрическое прогнозирование: выбор ядра из набора, настройка параметров (пример)]] | ||
+ | |||
+ | - | ||
+ | | Михаил Кокшаров | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | |[[Экспоненциальное сглаживание и прогноз (пример)]] | ||
+ | |||
+ | - | ||
+ | |Бурмистров Михаил | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | |[[Выравнивание временных рядов: прогнозирование с использованием DTW (пример)]] | ||
+ | |||
+ | - | ||
+ | |Романенко Александр | ||
+ | |||
+ | - | ||
+ | |Егор Будников | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | |[[Многомерная авторегрессия (пример)]] | ||
+ | |||
+ | - | ||
+ | |Ямщиков Илья | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | |[[Локальные методы прогнозирования,поиск метрики (пример)]] | ||
+ | |||
+ | - | ||
+ | |Евгений Гребенников | ||
+ | |||
+ | - | ||
+ | |Михаил Кокшаров | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | |[[Локальные методы прогнозирования,поиск инвариантного преобразования (пример)]] | ||
+ | |||
+ | - | ||
+ | |Юлия Хаспулатова | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | |[[Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж)]] | ||
+ | |||
+ | - | ||
+ | |Токмакова Александра | ||
+ | |||
+ | - | ||
+ | |Будников Егор | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | |[[Многомерная гусеница, выбор временных рядов при прогнозировании(пример)]] | ||
+ | |||
+ | - | ||
+ | |Элина Торчинская | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | |[[Прогнозирование и аппроксимация сплайнами]] | ||
+ | |||
+ | - | ||
+ | |Мищенко Павел | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | |[[ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию)(пример)]] | ||
+ | |||
+ | - | ||
+ | |Ганусевич Ирина | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | |[[Прогнозирование и SVN – регрессия(пример)]] | ||
+ | |||
+ | - | ||
+ | |Ситник Александр | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | | | ||
+ | |||
+ | - | ||
+ | |- | ||
+ | |||
+ | - | ||
+ | |} | ||
+ | |||
+ | - | ||
+ | |||
+ | - | ||
+ | {{tip|В конце названия слово "(пример)" является ключевым и означает "пример работы алгоритма".}} | ||
+ | |||
+ | - | ||
+ | |||
+ | - | ||
+ | |||
+ | - | ||
+ | ==Краткое описание задач== | ||
+ | |||
+ | - | ||
+ | === [[Краткосрочное прогнозирование почасовых цен на электроэнергию (пример)]] === | ||
+ | |||
+ | - | ||
+ | Описание задачи. | ||
+ | |||
+ | - | ||
+ | |||
+ | - | ||
+ | === Задача 2: [[Экспоненциальное сглаживание и прогноз (пример)]] === | ||
+ | |||
+ | - | ||
+ | Прогнозирование методом экспоненциальной регрессии является идейно простым алгоритмом прогнозирования временных рядов. Идея метода основана на учете предшествующих значений ряда с убывающими весами. В своей простейшей реализации алгоритм сильно сглаживает ряд и плохо учитывает тренды, сезонность и резкие изменения в тренде, а также необоснованно заметно реагирует на выбросы в данных. Предполагается изучение и реализация алгоритмов, пытающихся найти оптимальную модель путем минимизации ошибки на известном временном ряду. | ||
+ | |||
+ | - | ||
+ | |||
+ | - | ||
+ | === Задача 3: [[Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж) (пример)]] === | ||
+ | |||
+ | - | ||
+ | |||
+ | - | ||
+ | Целью проекта является нахождение закономерности в определённом процессе и сравнение базового алгоритма, проводящего прогнозирование с помощью скользящего среднего, с алгоритмом, учитывающим цикличность задачи. Также необходимо исследовать различные флуктуации входящих параметров и минимизировать при этом отклонения. | ||
+ | |||
+ | - | ||
+ | |||
+ | - | ||
+ | Данный алгоритм можно использовать при прогнозировании цен, объёмов продаж, туристических потоков – любых процессов, подразумевающих наличие временных рядов с периодической составляющей. Алгоритм не предусмотрен для работы в авральных ситуациях, таких как: промо-акции, праздники и т.д. - данные ситуации описываются отдельной задачей. Результатом проекта является оценка эффективности алгоритма, учитывающего цикличность задачи. | ||
+ | |||
+ | - | ||
+ | |||
+ | - | ||
+ | ===Задача 4: [[Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)]]=== | ||
+ | |||
+ | - | ||
+ | |||
+ | - | ||
+ | Требуется исследовать SSA-алгоритм (метод гусеницы) для многомерных временных рядов. Метод заключается в преобразовании ряда с помощью однопараметрической сдвиговой процедуры с последующим исследованием полученной траектории с помощью анализа главных компонент и восстановлением ряда по выбранным главным компонентам. В работе будет исследован вопрос выбора длины гусеницы и числа ее компонент, т.е. то, как определить по полученному разложению на компоненты, какие из них являются неинформативными (шумы). Также метод помогает увидеть и выделить разного рода закономерности в поведении временных рядов. | ||
+ | |||
+ | - | ||
+ | |||
+ | - | ||
+ | Результатом работы является выяснение эффективности работы алгоритма в зависимости от длины и числа компонент гусеницы, а также выяснение возможностей алгоритма и его области применимости. | ||
+ | |||
+ | - | ||
+ | |||
+ | - | ||
+ | ===Задача 7: [[Локальные методы прогнозирования,поиск метрики (пример)]]=== | ||
+ | |||
+ | - | ||
+ | Временной ряд делится на отдельные участки, каждому из которых сопоставляется точка в n-мерном пространстве признаков. Локальная модель рассчитывается в три последовательных этапа. | ||
+ | |||
+ | - | ||
+ | Первый – находит k-ближайших соседей наблюдаемой точки. | ||
+ | |||
+ | - | ||
+ | Второй – строит простую модель, используя только этих k соседей. | ||
+ | |||
+ | - | ||
+ | Третий – используя даную модель, по наблюдаемой точке прогнозирует следующую. | ||
+ | |||
+ | - | ||
+ | Многие исследователи, используют эвклидову метрику для измерения расстояний между точками. | ||
+ | |||
+ | - | ||
+ | Данная работа призвана сравнить точность прогнозирования при использовании различных метрик. | ||
+ | |||
+ | - | ||
+ | В частности, требуется исследовать оптимальный набор весов во взвешенной метрике для максимизации точности прогнозирования. | ||
+ | |||
+ | - | ||
+ | |||
===Задача 8: [[Локальные методы прогнозирования, поиск инвариантного преобразования (пример)]]=== | ===Задача 8: [[Локальные методы прогнозирования, поиск инвариантного преобразования (пример)]]=== | ||
В проекте используются локальные методы прогнозирования | В проекте используются локальные методы прогнозирования | ||
- | + | ||
- | + | ||
- | + | ||
В данной работе подробно исследован следующий метод (обобщение классического | В данной работе подробно исследован следующий метод (обобщение классического | ||
+ | |||
«ближайшего соседа»). | «ближайшего соседа»). | ||
+ | - | ||
+ | Пусть ) ,..., ( ~ | ||
+ | + | ||
Пусть имеется временной ряд, и стоит задача требуется продолжить его. Предполагается, что такое продолжение определяется | Пусть имеется временной ряд, и стоит задача требуется продолжить его. Предполагается, что такое продолжение определяется | ||
+ | - | ||
+ | 1 n f f f = – временной ряд, требуется продолжить его | ||
+ | + | ||
«предысторией», т.е. в ряде нужно найти часть, которая после | «предысторией», т.е. в ряде нужно найти часть, которая после | ||
+ | - | ||
+ | 1 1 t n n n f f f f g + + = . Предполагается, что такое продолжение определяется | ||
+ | + | ||
некоторого преобразования A «становится похожа» на ту часть, которую мы стремимся прогнозировать. Поиск такого преобразования A и есть цель данного проекта. Для определения степени «похожести» используется метрика B – функция близости двух отрезков | некоторого преобразования A «становится похожа» на ту часть, которую мы стремимся прогнозировать. Поиск такого преобразования A и есть цель данного проекта. Для определения степени «похожести» используется метрика B – функция близости двух отрезков | ||
+ | - | ||
+ | «предысторией» ) ,..., ( 1 n l n f f + - , т.е. в ряде нужно найти часть ) ,..., ( 1 k l k f f + - , которая после | ||
+ | + | ||
временного ряда (подробнее об этом см.[[Локальные методы прогнозирования, поиск инвариантного преобразования (пример)]]). Так мы находим ближайшего соседа к нашей предыстории. В общем случае ищем несколько | временного ряда (подробнее об этом см.[[Локальные методы прогнозирования, поиск инвариантного преобразования (пример)]]). Так мы находим ближайшего соседа к нашей предыстории. В общем случае ищем несколько | ||
+ | - | ||
+ | некоторого преобразования A «становится похожа» на ) ,..., ( 1 n l n f f + - : | ||
+ | + | ||
ближайших соседей. Продолжение запишется в виде их линейной комбинации. | ближайших соседей. Продолжение запишется в виде их линейной комбинации. | ||
- | + | - | |
+ | a k k l k k l k f f f f A B ~ , 1 1 min ) ) ,..., ( ), ,..., ( ( ® + - + - , | ||
+ | + | ||
+ | - | ||
+ | здесь a~ – параметры преобразования A, B – функция близости двух отрезков | ||
+ | + | ||
+ | - | ||
+ | временного ряда (например, евклидово расстояние между отрезками или взвешенное | ||
+ | + | ||
+ | - | ||
+ | евклидово расстояние, которое «последним» точкам приписывает больший вес). | ||
+ | + | ||
+ | - | ||
+ | Определив k , мы находим ближайшего соседа к нашей предыстории. Искомое | ||
+ | + | ||
+ | - | ||
+ | продолжение запишется в виде ) ,..., ( 1 t k k f f A + + . В общем случае ищем несколько | ||
+ | + | ||
+ | - | ||
+ | ближайших соседей. Продолжение запишется в виде их линейной комбинации | ||
+ | + | ||
+ | - | ||
+ | å å = + + | ||
+ | + | ||
+ | - | ||
+ | r | ||
+ | + | ||
+ | - | ||
+ | r | ||
+ | + | ||
+ | - | ||
+ | r | ||
+ | + | ||
+ | - | ||
+ | t k k r c f f A c r r 1 , ) ,..., ( 1 . | ||
+ | + | ||
=== Задача 9: [[Выравнивание временных рядов: прогнозирование с использованием DTW (пример)]] === | === Задача 9: [[Выравнивание временных рядов: прогнозирование с использованием DTW (пример)]] === | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
===Задача 12: [[Исследование сходимости при прогнозировании нейронными сетями с боратной связью (пример)]]=== | ===Задача 12: [[Исследование сходимости при прогнозировании нейронными сетями с боратной связью (пример)]]=== | ||
- | + | ||
- | Цель проекта - иследовать зависимость сходимости прогнозирования от параметров нейронной сети. Понятие обратной связи характерно для динамических систем, в которой выходной сигнал некоторого элемента истемы оказыает влияние на входной сигнал этого элемента. Входной Сигнал <tex>x_{j}(n)</tex>, внутренний сигнал <tex>x_{j}^{'}(n)</tex> и выходной сигнал <tex>y_{j}(n)</tex> связаны соотношениями: <tex>y_{k}(n) = A[x_{j}^{'}(n)]</tex>; | + | |
- | + | Цель проекта - иследовать зависимость сходимости прогнозирования от параметров нейронной сети. Понятие обратной связи характерно для динамических систем, в которой выходной сигнал некоторого элемента истемы оказыает влияние на входной сигнал этого элемента. Входной Сигнал <tex>x_{j}(n)</tex>, внутренний сигнал <tex>x_{j}^{'}(n)</tex> и выходной сигнал <tex>y_{j}(n)</tex> связаны соотношениями: <tex>y_{k}(n) = A[x_{j}^{'}(n)]</tex>; <tex>x_{j}^{'}(n) = x_{j}(n) + B[y_{j}(n)] </tex> | |
- | + | ||
===Задача 13: [[Многомерная гусеница, выбор временных рядов при прогнозировании(пример)]]=== | ===Задача 13: [[Многомерная гусеница, выбор временных рядов при прогнозировании(пример)]]=== | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- |
Версия 22:20, 2 марта 2011
-
-
- Перед выполнением заданий рекомендуются к прочтению
-
-
-
-
-
Задачи
-
-
-
В конце названия слово "(пример)" является ключевым и означает "пример работы алгоритма". |
-
-
-
Краткое описание задач
-
Краткосрочное прогнозирование почасовых цен на электроэнергию (пример)
- Описание задачи.
-
-
Задача 2: Экспоненциальное сглаживание и прогноз (пример)
- Прогнозирование методом экспоненциальной регрессии является идейно простым алгоритмом прогнозирования временных рядов. Идея метода основана на учете предшествующих значений ряда с убывающими весами. В своей простейшей реализации алгоритм сильно сглаживает ряд и плохо учитывает тренды, сезонность и резкие изменения в тренде, а также необоснованно заметно реагирует на выбросы в данных. Предполагается изучение и реализация алгоритмов, пытающихся найти оптимальную модель путем минимизации ошибки на известном временном ряду.
-
-
Задача 3: Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж) (пример)
-
- Целью проекта является нахождение закономерности в определённом процессе и сравнение базового алгоритма, проводящего прогнозирование с помощью скользящего среднего, с алгоритмом, учитывающим цикличность задачи. Также необходимо исследовать различные флуктуации входящих параметров и минимизировать при этом отклонения.
-
- Данный алгоритм можно использовать при прогнозировании цен, объёмов продаж, туристических потоков – любых процессов, подразумевающих наличие временных рядов с периодической составляющей. Алгоритм не предусмотрен для работы в авральных ситуациях, таких как: промо-акции, праздники и т.д. - данные ситуации описываются отдельной задачей. Результатом проекта является оценка эффективности алгоритма, учитывающего цикличность задачи.
-
-
Задача 4: Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)
-
- Требуется исследовать SSA-алгоритм (метод гусеницы) для многомерных временных рядов. Метод заключается в преобразовании ряда с помощью однопараметрической сдвиговой процедуры с последующим исследованием полученной траектории с помощью анализа главных компонент и восстановлением ряда по выбранным главным компонентам. В работе будет исследован вопрос выбора длины гусеницы и числа ее компонент, т.е. то, как определить по полученному разложению на компоненты, какие из них являются неинформативными (шумы). Также метод помогает увидеть и выделить разного рода закономерности в поведении временных рядов.
-
- Результатом работы является выяснение эффективности работы алгоритма в зависимости от длины и числа компонент гусеницы, а также выяснение возможностей алгоритма и его области применимости.
-
-
Задача 7: Локальные методы прогнозирования,поиск метрики (пример)
- Временной ряд делится на отдельные участки, каждому из которых сопоставляется точка в n-мерном пространстве признаков. Локальная модель рассчитывается в три последовательных этапа.
- Первый – находит k-ближайших соседей наблюдаемой точки.
- Второй – строит простую модель, используя только этих k соседей.
- Третий – используя даную модель, по наблюдаемой точке прогнозирует следующую.
- Многие исследователи, используют эвклидову метрику для измерения расстояний между точками.
- Данная работа призвана сравнить точность прогнозирования при использовании различных метрик.
- В частности, требуется исследовать оптимальный набор весов во взвешенной метрике для максимизации точности прогнозирования.
-
Задача 8: Локальные методы прогнозирования, поиск инвариантного преобразования (пример)
В проекте используются локальные методы прогнозирования
В данной работе подробно исследован следующий метод (обобщение классического
«ближайшего соседа»). - Пусть ) ,..., ( ~ + Пусть имеется временной ряд, и стоит задача требуется продолжить его. Предполагается, что такое продолжение определяется - 1 n f f f = – временной ряд, требуется продолжить его + «предысторией», т.е. в ряде нужно найти часть, которая после - 1 1 t n n n f f f f g + + = . Предполагается, что такое продолжение определяется + некоторого преобразования A «становится похожа» на ту часть, которую мы стремимся прогнозировать. Поиск такого преобразования A и есть цель данного проекта. Для определения степени «похожести» используется метрика B – функция близости двух отрезков - «предысторией» ) ,..., ( 1 n l n f f + - , т.е. в ряде нужно найти часть ) ,..., ( 1 k l k f f + - , которая после + временного ряда (подробнее об этом см.Локальные методы прогнозирования, поиск инвариантного преобразования (пример)). Так мы находим ближайшего соседа к нашей предыстории. В общем случае ищем несколько - некоторого преобразования A «становится похожа» на ) ,..., ( 1 n l n f f + - : + ближайших соседей. Продолжение запишется в виде их линейной комбинации. - a k k l k k l k f f f f A B ~ , 1 1 min ) ) ,..., ( ), ,..., ( ( ® + - + - , + - здесь a~ – параметры преобразования A, B – функция близости двух отрезков + - временного ряда (например, евклидово расстояние между отрезками или взвешенное + - евклидово расстояние, которое «последним» точкам приписывает больший вес). + - Определив k , мы находим ближайшего соседа к нашей предыстории. Искомое + - продолжение запишется в виде ) ,..., ( 1 t k k f f A + + . В общем случае ищем несколько + - ближайших соседей. Продолжение запишется в виде их линейной комбинации + - å å = + + + - r + - r + - r + - t k k r c f f A c r r 1 , ) ,..., ( 1 . +
Задача 9: Выравнивание временных рядов: прогнозирование с использованием DTW (пример)
Задача 12: Исследование сходимости при прогнозировании нейронными сетями с боратной связью (пример)
Цель проекта - иследовать зависимость сходимости прогнозирования от параметров нейронной сети. Понятие обратной связи характерно для динамических систем, в которой выходной сигнал некоторого элемента истемы оказыает влияние на входной сигнал этого элемента. Входной Сигнал , внутренний сигнал и выходной сигнал связаны соотношениями: ;