Участник:Angriff

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Отчеты о научно-исследовательской работе)
Строка 87: Строка 87:
'''Гранты'''
'''Гранты'''
*Президентская государственная академическая стипендия
*Президентская государственная академическая стипендия
 +
 +
=== Осень 2013, 11-й семестр ===
 +
'''Применение методов машинного обучения к выделению временных выражений в русскоязычных текстах'''
 +
 +
''В работе рассматривается задача выделения выражений, имеющих временную окраску. Ставится формальная постановка задачи, приводится обзор методов решения задачи для английского, итальянского и китайского языков. Также описывается решения задачи для русского языка: описывается base-line алгоритм основанный на правилах, способ разметки обучающей выборки, а также методы машинного обучения, применяемые для решения задачи. Также приводятся результаты вычислительного экспериментов для этих алгоритмов.''
 +
 +
'''Доклад на научной конференции'''
 +
*{{Статья
 +
|автор = Романенко А.А.
 +
|название = Применение методов машинного обучения для выделения временных выражений в текстах на естественном языке
 +
|журнал = 56-я научная конференция МФТИ "МФТИ-56"
 +
|год = 2013
 +
}}
 +
 +
'''Подготовленные публикации'''
 +
*{{Статья
 +
|автор = Романенко А.А.
 +
|название = Применение методов машинного обучения к выделению временных выражений в русскоязычных текстах
 +
|год = 2013
 +
}}

Версия 17:25, 4 января 2014

Романенко Александр

МФТИ, ФУПМ

Кафедра "Интеллектуальные системы"

Направление "Интеллектуальный анализ данных"

Mailto: angriff07@gmail.com

Отчеты о научно-исследовательской работе

Весна 2011, 6-й семестр

Выравнивание временных рядов: прогнозирование с использованием DTW

Временной ряд - это повсеместно встечающаяся форма представления данных во многих научных дисциплинах. Задача, сопутствующая появлению временных рядов, - сравнение одной последовательности данных с другой. Dynamic time warping (DTW) представляет собой технику эффективного выравнивая временных рядов. Методы DTW используются при распознавании речи, при анализе информации в робототехнике, в промышленности, в медицине и других сферах. Предлагается классический алгоритм DTW и упоминаются его возможные модификации. В работе описывается алгоритм поиска в последовательности подпоследовательности, "больше всего похожей" на данную последовательность. Приведены результаты работы алгоритма.

Публикация

Осень 2011, 7-й семестр

Событийное моделирование и прогноз финансовых временных рядов

Финансовые временные ряды обычно сильно зашумлены и зависят от других временных рядов (курс доллара, пошлины на таможне, и т.д.). Но насколько сильна эта зависимость, какие факторы учитывать при их прогнозировании, однозначно определить непросто. В работе для прогнозирования поведения целевого ряда используется разметка временных рядов. Предлагается алгоритм порождения признаков из размеченных временных рядов и генетический алгоритм отбора признаков на размеченных временных рядах.

Публикации

Гранты

  • Президентская государственная академическая стипендия

Весна 2012, 8-й семестр

Кластеризация коллекции текстов

В работе предлагается метод кластеризации текстовой коллекции с помощью стандартных метрических алгоритмов, например, K-means. Для этого вводится функция расстояния между текстами, учитывающая "схожесть" лексики используемой в тексте. В работе также исследуется соответствие между введенным расстоянием на множестве реальных текстов и близостью тематик этих текстов. Возможность кластеризации и соответствие ее результатов с заранее известным распределением текстов по тематике исследована в вычислительном эксперименте на синтетической коллекции текстов.

Публикации

Гранты

  • Президентская государственная академическая стипендия

Осень 2012, 9-й семестр

Определение границ дорожек печатных плат с~помощью одноклассового классификатора

Рассматривается задача определения границ дорожек печатных плат на изображениях. Решать задачу предлагается с помощью одноклассовой классификации. Для этого строится вероятностная модель описания множества граничных пикселей. Показывается, что эта модель является обобщением модели Такса, построенной из чисто эвристических предположений. Также предлагается использовать L_1-регуляризацию признаков.

Планируемые публикации

  • Будников Е.А., Романенко А.А. Определение границ дорожек печатных плат с~помощью одноклассового классификатора // Машинное обучение и анализ данных. — 2013.

Гранты

  • Президентская государственная академическая стипендия

Осень 2013, 11-й семестр

Применение методов машинного обучения к выделению временных выражений в русскоязычных текстах

В работе рассматривается задача выделения выражений, имеющих временную окраску. Ставится формальная постановка задачи, приводится обзор методов решения задачи для английского, итальянского и китайского языков. Также описывается решения задачи для русского языка: описывается base-line алгоритм основанный на правилах, способ разметки обучающей выборки, а также методы машинного обучения, применяемые для решения задачи. Также приводятся результаты вычислительного экспериментов для этих алгоритмов.

Доклад на научной конференции

  • Романенко А.А. Применение методов машинного обучения для выделения временных выражений в текстах на естественном языке // 56-я научная конференция МФТИ "МФТИ-56". — 2013.

Подготовленные публикации

  • Романенко А.А. Применение методов машинного обучения к выделению временных выражений в русскоязычных текстах. — 2013.
Личные инструменты