Участник:Angriff
Материал из MachineLearning.
(→Отчеты о научно-исследовательской работе) |
|||
Строка 87: | Строка 87: | ||
'''Гранты''' | '''Гранты''' | ||
*Президентская государственная академическая стипендия | *Президентская государственная академическая стипендия | ||
+ | |||
+ | === Осень 2013, 11-й семестр === | ||
+ | '''Применение методов машинного обучения к выделению временных выражений в русскоязычных текстах''' | ||
+ | |||
+ | ''В работе рассматривается задача выделения выражений, имеющих временную окраску. Ставится формальная постановка задачи, приводится обзор методов решения задачи для английского, итальянского и китайского языков. Также описывается решения задачи для русского языка: описывается base-line алгоритм основанный на правилах, способ разметки обучающей выборки, а также методы машинного обучения, применяемые для решения задачи. Также приводятся результаты вычислительного экспериментов для этих алгоритмов.'' | ||
+ | |||
+ | '''Доклад на научной конференции''' | ||
+ | *{{Статья | ||
+ | |автор = Романенко А.А. | ||
+ | |название = Применение методов машинного обучения для выделения временных выражений в текстах на естественном языке | ||
+ | |журнал = 56-я научная конференция МФТИ "МФТИ-56" | ||
+ | |год = 2013 | ||
+ | }} | ||
+ | |||
+ | '''Подготовленные публикации''' | ||
+ | *{{Статья | ||
+ | |автор = Романенко А.А. | ||
+ | |название = Применение методов машинного обучения к выделению временных выражений в русскоязычных текстах | ||
+ | |год = 2013 | ||
+ | }} |
Версия 17:25, 4 января 2014
Романенко Александр
МФТИ, ФУПМ
Кафедра "Интеллектуальные системы"
Направление "Интеллектуальный анализ данных"
Mailto: angriff07@gmail.com
Отчеты о научно-исследовательской работе
Весна 2011, 6-й семестр
Выравнивание временных рядов: прогнозирование с использованием DTW
Временной ряд - это повсеместно встечающаяся форма представления данных во многих научных дисциплинах. Задача, сопутствующая появлению временных рядов, - сравнение одной последовательности данных с другой. Dynamic time warping (DTW) представляет собой технику эффективного выравнивая временных рядов. Методы DTW используются при распознавании речи, при анализе информации в робототехнике, в промышленности, в медицине и других сферах. Предлагается классический алгоритм DTW и упоминаются его возможные модификации. В работе описывается алгоритм поиска в последовательности подпоследовательности, "больше всего похожей" на данную последовательность. Приведены результаты работы алгоритма.
Публикация
- Романенко А.А. Выравнивание временных рядов: прогнозирование с использованием DTW // Машинное обучение и анализ данных. — 2011. — № 1. — С. 77-85. — ISSN 2223-3792.
Осень 2011, 7-й семестр
Событийное моделирование и прогноз финансовых временных рядов
Финансовые временные ряды обычно сильно зашумлены и зависят от других временных рядов (курс доллара, пошлины на таможне, и т.д.). Но насколько сильна эта зависимость, какие факторы учитывать при их прогнозировании, однозначно определить непросто. В работе для прогнозирования поведения целевого ряда используется разметка временных рядов. Предлагается алгоритм порождения признаков из размеченных временных рядов и генетический алгоритм отбора признаков на размеченных временных рядах.
Публикации
- Романенко А.А. Событийное моделирование и прогноз финансовых временных рядов // Машинное обучение и анализ данных. — 2011. — № 2. — С. 236-243. — ISSN 2223-3792.
Гранты
- Президентская государственная академическая стипендия
Весна 2012, 8-й семестр
Кластеризация коллекции текстов
В работе предлагается метод кластеризации текстовой коллекции с помощью стандартных метрических алгоритмов, например, K-means. Для этого вводится функция расстояния между текстами, учитывающая "схожесть" лексики используемой в тексте. В работе также исследуется соответствие между введенным расстоянием на множестве реальных текстов и близостью тематик этих текстов. Возможность кластеризации и соответствие ее результатов с заранее известным распределением текстов по тематике исследована в вычислительном эксперименте на синтетической коллекции текстов.
Публикации
- Романенко А.А. Кластеризация коллекции текстов // Машинное обучение и анализ данных. — 2011. — № 3. — С. 305-311. — ISSN 2223-3792.
Гранты
- Президентская государственная академическая стипендия
Осень 2012, 9-й семестр
Определение границ дорожек печатных плат с~помощью одноклассового классификатора
Рассматривается задача определения границ дорожек печатных плат на изображениях. Решать задачу предлагается с помощью одноклассовой классификации. Для этого строится вероятностная модель описания множества граничных пикселей. Показывается, что эта модель является обобщением модели Такса, построенной из чисто эвристических предположений. Также предлагается использовать -регуляризацию признаков.
Планируемые публикации
- Будников Е.А., Романенко А.А. Определение границ дорожек печатных плат с~помощью одноклассового классификатора // Машинное обучение и анализ данных. — 2013.
Гранты
- Президентская государственная академическая стипендия
Осень 2013, 11-й семестр
Применение методов машинного обучения к выделению временных выражений в русскоязычных текстах
В работе рассматривается задача выделения выражений, имеющих временную окраску. Ставится формальная постановка задачи, приводится обзор методов решения задачи для английского, итальянского и китайского языков. Также описывается решения задачи для русского языка: описывается base-line алгоритм основанный на правилах, способ разметки обучающей выборки, а также методы машинного обучения, применяемые для решения задачи. Также приводятся результаты вычислительного экспериментов для этих алгоритмов.
Доклад на научной конференции
- Романенко А.А. Применение методов машинного обучения для выделения временных выражений в текстах на естественном языке // 56-я научная конференция МФТИ "МФТИ-56". — 2013.
Подготовленные публикации
- Романенко А.А. Применение методов машинного обучения к выделению временных выражений в русскоязычных текстах. — 2013.