Участник:Angriff
Материал из MachineLearning.
Романенко Александр
МФТИ, ФУПМ
Кафедра "Интеллектуальные системы"
Направление "Интеллектуальный анализ данных"
Mailto: angriff07@gmail.com
Отчеты о научно-исследовательской работе
Весна 2011, 6-й семестр
Выравнивание временных рядов: прогнозирование с использованием DTW
Временной ряд - это повсеместно встечающаяся форма представления данных во многих научных дисциплинах. Задача, сопутствующая появлению временных рядов, - сравнение одной последовательности данных с другой. Dynamic time warping (DTW) представляет собой технику эффективного выравнивая временных рядов. Методы DTW используются при распознавании речи, при анализе информации в робототехнике, в промышленности, в медицине и других сферах. Предлагается классический алгоритм DTW и упоминаются его возможные модификации. В работе описывается алгоритм поиска в последовательности подпоследовательности, "больше всего похожей" на данную последовательность. Приведены результаты работы алгоритма.
Публикация
- Романенко А.А. Выравнивание временных рядов: прогнозирование с использованием DTW // Машинное обучение и анализ данных. — 2011. — № 1. — С. 77-85. — ISSN 2223-3792.
Осень 2011, 7-й семестр
Событийное моделирование и прогноз финансовых временных рядов
Финансовые временные ряды обычно сильно зашумлены и зависят от других временных рядов (курс доллара, пошлины на таможне, и т.д.). Но насколько сильна эта зависимость, какие факторы учитывать при их прогнозировании, однозначно определить непросто. В работе для прогнозирования поведения целевого ряда используется разметка временных рядов. Предлагается алгоритм порождения признаков из размеченных временных рядов и генетический алгоритм отбора признаков на размеченных временных рядах.
Публикации
- Романенко А.А. Событийное моделирование и прогноз финансовых временных рядов // Машинное обучение и анализ данных. — 2011. — № 2. — С. 236-243. — ISSN 2223-3792.
Гранты
- Президентская государственная академическая стипендия
Весна 2012, 8-й семестр
Кластеризация коллекции текстов
В работе предлагается метод кластеризации текстовой коллекции с помощью стандартных метрических алгоритмов, например, K-means. Для этого вводится функция расстояния между текстами, учитывающая "схожесть" лексики используемой в тексте. В работе также исследуется соответствие между введенным расстоянием на множестве реальных текстов и близостью тематик этих текстов. Возможность кластеризации и соответствие ее результатов с заранее известным распределением текстов по тематике исследована в вычислительном эксперименте на синтетической коллекции текстов.
Публикации
- Романенко А.А. Кластеризация коллекции текстов // Машинное обучение и анализ данных. — 2011. — № 3. — С. 305-311. — ISSN 2223-3792.
Гранты
- Президентская государственная академическая стипендия
Осень 2012, 9-й семестр
Определение границ дорожек печатных плат с~помощью одноклассового классификатора
Рассматривается задача определения границ дорожек печатных плат на изображениях. Решать задачу предлагается с помощью одноклассовой классификации. Для этого строится вероятностная модель описания множества граничных пикселей. Показывается, что эта модель является обобщением модели Такса, построенной из чисто эвристических предположений. Также предлагается использовать -регуляризацию признаков.
Планируемые публикации
- Будников Е.А., Романенко А.А. Определение границ дорожек печатных плат с~помощью одноклассового классификатора // Машинное обучение и анализ данных. — 2013.
Гранты
- Президентская государственная академическая стипендия