Участник:Yegor.Budnikov
Материал из MachineLearning.
МФТИ, ФУПМ
Кафедра "Интеллектуальные системы"
Направление "Интеллектуальный анализ данных"
Mailto: yegor.budnikov@gmail.com
Отчеты о научно-исследовательской работе
Весна 2011, 6-й семестр
Прогнозирование функциями дискретного аргумента
В работе исследуются короткие временные ряды на примере монофонических музыкальных мелодий. Происходит прогнозирование одной ноты экспоненциальным сглаживанием, локальным методом, а также методом поиска постоянных закономерностей.
Вычислительный эксперимент проводится на двух мелодиях, одна из которых имеет точно повторяющиеся фрагменты.
Публикация
- Будников Е.А. Прогнозирование функциями дискретного аргумента // Машинное обучение и анализ данных. — 2011. — № 1. — С. 85-91. — ISSN 2223-3792.
Осень 2011, 7-й семестр
Обзор некоторых статистических моделей естественных языков
В работе производится обзор и сравнение следующих моделей натурального языка: -граммы, -граммы на классах, дисконтная модель.
В первой части работы проводится обзор основной литературы по данной тематике, во второй части вводятся основные понятия и описываются сами методы.
Публикации
- Будников Е.А. Обзор некоторых статистических моделей естественных языков // Машинное обучение и анализ данных. — 2011. — № 2. — С. 245-250. — ISSN 2223-3792.
Весна 2012, 8-й семестр
Оценивание вероятностей появления строк в естественном языке
В работе рассматривается задача оценивания вероятностей появления строк в естественном языке. Для решения задачи используется модель -грамм. Для решения проблемы большого числа параметров предлагается использовать модель -грамм на классах. Для решения проблемы нулевых вероятностей строк предлагается использовать три дисконтные модели: Гуда-Тьюринга, Катца и абсолютного дисконтирования.
Вводятся основные определения и описываются методы, а также алгоритм построения классов в модели -грамм на классах. Описывается проведённый эксперимент на синтетических данных.
Публикации
- Будников Е.А. Оценивание вероятностей появления строк в естественном языке // Машинное обучение и анализ данных. — 2012. — № 3. — С. 376-386. — ISSN 2223-3792.
Гранты
- Президентская государственная академическая стипендия
Осень 2012, 9-й семестр
Оценивание вероятностей появления строк в коллекции документов
В работе рассматривается задача оценивания вероятностей появления строк в документах. Для решения задачи используется модель n-грамм. Для решения проблемы большого числа параметров предлагается использовать модель n-грамм на классах. Для решения проблемы нулевых вероятностей появления строк используется три дисконтные модели: Гуда-Тьюринга, Катца и абсолютного дисконтирования. Описывается проведённый эксперимент на синтетических данных. Предлагаемая модель проиллюстрирована вычислительным экспериментом на реальных данных.
Публикации
- Будников Е.А., Стрижов В.В. Оценивание вероятностей появления строк в коллекции документов. — {{{год}}}.
Работа над статьёй Определение границ дорожек печатных плат на изображениях с помощью одноклассовой классификации
Рассматривается задача определения границ дорожек печатных плат на изображениях. Решать задачу предлагается с помощью одноклассовой классификации. Для этого строится вероятностная модель описания множества граничных пикселей. Показывается, что эта модель является обобщением модели Такса, построенной из чисто эвристических предположений. Также предлагается использовать -регуляризацию признаков.
Публикации
- Будников Е.А., Романенко А.А Определение границ дорожек печатных плат на изображениях с помощью одноклассовой классификации. — {{{год}}}.
Гранты
- Президентская государственная академическая стипендия