Участник:AntonVoronov
Материал из MachineLearning.
(Новая: == 2019 == === Задача 1 === * '''Название:''' Прогнозирование направления движения цены биржевых инструментов п...) |
|||
Строка 16: | Строка 16: | ||
* '''Новизна:''' Обоснование новизны и значимости идей (для редколлегии и рецензентов журнала). | * '''Новизна:''' Обоснование новизны и значимости идей (для редколлегии и рецензентов журнала). | ||
* '''Авторы:''' В.В. Стрижов (эксперт), К.В. Воронцов (эксперт), Иван Запутляев (консультант) | * '''Авторы:''' В.В. Стрижов (эксперт), К.В. Воронцов (эксперт), Иван Запутляев (консультант) | ||
+ | |||
+ | === Задача 2 === | ||
+ | * '''Название:''' Исследование опорных объектов в задаче метрической классификации временных рядов. | ||
+ | * '''Задача:''' Функция DTW - это расстояние между двумя временными рядами, которые могут быть нелинейно деформированы друг относительно друга. Она ищет наилучшее выравнивание между двумя объектами, поэтому ее можно использовать в задаче метрической классификации объектов. | ||
+ | Один из методов решения задачи метрической классификации - измерение расстояний до опорных объектов и использование вектора этих расстояний в качестве признакового описания объекта. | ||
+ | Метод DBA - это алгоритм построения центроидов (опорных объектов) для временных рядов на основе расстояния DTW. При построении расстояния между временным рядом и центроидом различные пары значений (например пиковые значения) более характерны для одного из классов, и влияние таких совпадений на значение расстояния должна быть выше. | ||
+ | Необходимо исследовать различные способы построения опорных объектов, а также определение их оптимального числа. Критерием является качество работы метрического классификатора в задаче. | ||
+ | В методе DBA для каждого центроида предлагается создавать вектор весов, который демонстрирует "значимость" измерений центриода, и использовать его в модифицированной функции расстояния weighted-DTW. | ||
+ | * '''Дано:''' Не указано. | ||
+ | * '''Данные:''' Данные описывают 6 классов временных рядов с акселерометра мобильного телефона. https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group274/Goncharov2015MetricClassification/data/ | ||
+ | * '''Литература:''' | ||
+ | *# DTW: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.215.7850&rep=rep1&type=pdf | ||
+ | *# DBA: https://hal.sorbonne-universite.fr/hal-01630288/document | ||
+ | *# weighted DTW: http://www.mathnet.ru/php/archive.phtml?wshow=paper&jrnid=ia&paperid=414&option_lang=rus | ||
+ | * '''Базовый алгоритм:''' Реализовать базовые методы: | ||
+ | - Выбор подмножества объектов обучающей выборки как опорных | ||
+ | - Предварительная обработка аномальных объектов | ||
+ | - Кластеризация объектов обучающей выборки для построения центроидов внутри кластера | ||
+ | - Использование метода DBA для построения опорных объектов | ||
+ | - Использование методы численной оптимизации для поиска оптимального вектора весов с заданными ограничениями | ||
+ | * '''Решение:''' Расширение типов ограничений на вид вектора весов: бинарный вектор, одинаковый вектор для всех центроидов, бинарный одинаковый вектор для всех центроидов. Такое решение позволит экономить затраты энергии при работе датчиков мобильного устройства. | ||
+ | Исследование литературы и комбинация up-to-date методов. | ||
+ | * '''Новизна:''' Не проводилось комплексного исследования различных способов построения центроидов и опорных элементов вместе с выбором их оптимального числа. | ||
+ | * '''Авторы:''' Алексей Гончаров (эксперт) |
Версия 15:01, 25 сентября 2018
2019
Задача 1
- Название: Прогнозирование направления движения цены биржевых инструментов по новостному потоку.
- Задача: Построить и исследовать модель прогнозирования направления движения цены.
- Дано: 1. Множество новостей S и множество временных меток T, соответствующих времени публикации новостей из S. 2. Временной ряд P, соответствующий значению цены биржевого инструмента, и временной ряд V, соответствующий объему продаж по данному инструменту, за период времени T'. 3. Множество T является подмножеством периода времени T'. 4. Временные отрезки w=[w0, w1], l=[l0, l1], d=[d0, d1], где w0 < w1=l0 < l1=d0 < d1. Требуется спрогнозировать направление движения цены биржевого инструмента в момент времени t=d0 по новостям, вышедшим в период w.
- Данные:
- Финансовые данные: данные о котировках (с интервалом в один тик) нескольких финансовых инструментов (GAZP, SBER, VTBR, LKOH) за 2 квартал 2017 года с сайта Finam.ru; для каждой точки ряда известны дата, время, цена и объем.
- Текстовые данные: экономические новости за 2 квартал 2017 года от компании Форексис; каждая новость является отдельным html файлом.
- Литература:
- Usmanova K.R., Kudiyarov S.P., Martyshkin R.V., Zamkovoy A.A., Strijov V.V. Analysis of relationships between indicators in forecasting cargo transportation // Systems and Means of Informatics, 2018, 28(3).
- Kuznetsov M.P., Motrenko A.P., Kuznetsova M.V., Strijov V.V. Methods for intrinsic plagiarism detection and author diarization // Working Notes of CLEF, 2016, 1609 : 912-919.
- Айсина Роза Мунеровна, Тематическое моделирование финансовых потоков корпоративных клиентов банка по транзакционным данным, выпускная квалификационная работа.
- Lee, Heeyoung, et al. "On the Importance of Text Analysis for Stock Price Prediction." LREC. 2014.
- Базовой алгоритм: Метод, использованный в статье (4).
- Решение: Использование тематического моделирования (ARTM) и локальных аппроксимирующих моделей для перевода последовательности текстов, соответствующих различным временным меткам, в единое признаковое описание. Критерий качества: F1-score, ROC AUC, прибыльность используемой стратегии.
- Новизна: Обоснование новизны и значимости идей (для редколлегии и рецензентов журнала).
- Авторы: В.В. Стрижов (эксперт), К.В. Воронцов (эксперт), Иван Запутляев (консультант)
Задача 2
- Название: Исследование опорных объектов в задаче метрической классификации временных рядов.
- Задача: Функция DTW - это расстояние между двумя временными рядами, которые могут быть нелинейно деформированы друг относительно друга. Она ищет наилучшее выравнивание между двумя объектами, поэтому ее можно использовать в задаче метрической классификации объектов.
Один из методов решения задачи метрической классификации - измерение расстояний до опорных объектов и использование вектора этих расстояний в качестве признакового описания объекта. Метод DBA - это алгоритм построения центроидов (опорных объектов) для временных рядов на основе расстояния DTW. При построении расстояния между временным рядом и центроидом различные пары значений (например пиковые значения) более характерны для одного из классов, и влияние таких совпадений на значение расстояния должна быть выше. Необходимо исследовать различные способы построения опорных объектов, а также определение их оптимального числа. Критерием является качество работы метрического классификатора в задаче. В методе DBA для каждого центроида предлагается создавать вектор весов, который демонстрирует "значимость" измерений центриода, и использовать его в модифицированной функции расстояния weighted-DTW.
- Дано: Не указано.
- Данные: Данные описывают 6 классов временных рядов с акселерометра мобильного телефона. https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group274/Goncharov2015MetricClassification/data/
- Литература:
- Базовый алгоритм: Реализовать базовые методы:
- Выбор подмножества объектов обучающей выборки как опорных - Предварительная обработка аномальных объектов - Кластеризация объектов обучающей выборки для построения центроидов внутри кластера - Использование метода DBA для построения опорных объектов - Использование методы численной оптимизации для поиска оптимального вектора весов с заданными ограничениями
- Решение: Расширение типов ограничений на вид вектора весов: бинарный вектор, одинаковый вектор для всех центроидов, бинарный одинаковый вектор для всех центроидов. Такое решение позволит экономить затраты энергии при работе датчиков мобильного устройства.
Исследование литературы и комбинация up-to-date методов.
- Новизна: Не проводилось комплексного исследования различных способов построения центроидов и опорных элементов вместе с выбором их оптимального числа.
- Авторы: Алексей Гончаров (эксперт)