Участник:Yegor.Budnikov

Материал из MachineLearning.

Перейти к: навигация, поиск

МФТИ, ФУПМ

Кафедра "Интеллектуальные системы"

Направление "Интеллектуальный анализ данных"

Mailto: yegor.budnikov@gmail.com

Отчеты о научно-исследовательской работе

Весна 2011, 6-й семестр

Прогнозирование функциями дискретного аргумента

В работе исследуются короткие временные ряды на примере монофонических музыкальных мелодий. Происходит прогнозирование одной ноты экспоненциальным сглаживанием, локальным методом, а также методом поиска постоянных закономерностей.

Вычислительный эксперимент проводится на двух мелодиях, одна из которых имеет точно повторяющиеся фрагменты.

Публикация

Осень 2011, 7-й семестр

Обзор некоторых статистических моделей естественных языков

В работе производится обзор и сравнение следующих моделей натурального языка: n-граммы, n-граммы на классах, дисконтная модель.

В первой части работы проводится обзор основной литературы по данной тематике, во второй части вводятся основные понятия и описываются сами методы.

Публикации

Весна 2012, 8-й семестр

Оценивание вероятностей появления строк в естественном языке

В работе рассматривается задача оценивания вероятностей появления строк в естественном языке. Для решения задачи используется модель n-грамм. Для решения проблемы большого числа параметров предлагается использовать модель n-грамм на классах. Для решения проблемы нулевых вероятностей строк предлагается использовать три дисконтные модели: Гуда-Тьюринга, Катца и абсолютного дисконтирования.

Вводятся основные определения и описываются методы, а также алгоритм построения классов в модели n-грамм на классах. Описывается проведённый эксперимент на синтетических данных.

Публикации

Гранты

  • Президентская государственная академическая стипендия


Осень 2012, 9-й семестр

Оценивание вероятностей появления строк в коллекции документов

В работе рассматривается задача оценивания вероятностей появления строк в документах. Для решения задачи используется модель n-грамм. Для решения проблемы большого числа параметров предлагается использовать модель n-грамм на классах. Для решения проблемы нулевых вероятностей появления строк используется три дисконтные модели: Гуда-Тьюринга, Катца и абсолютного дисконтирования. Описывается проведённый эксперимент на синтетических данных. Предлагаемая модель проиллюстрирована вычислительным экспериментом на реальных данных.

Публикации

  • Будников Е.А., Стрижов В.В. Оценивание вероятностей появления строк в коллекции документов. — {{{год}}}.

Работа над статьёй Определение границ дорожек печатных плат на изображениях с помощью одноклассовой классификации

Рассматривается задача определения границ дорожек печатных плат на изображениях. Решать задачу предлагается с помощью одноклассовой классификации. Для этого строится вероятностная модель описания множества граничных пикселей. Показывается, что эта модель является обобщением модели Такса, построенной из чисто эвристических предположений. Также предлагается использовать L_1-регуляризацию признаков.

Публикации

  • Будников Е.А., Романенко А.А Определение границ дорожек печатных плат на изображениях с помощью одноклассовой классификации. — {{{год}}}.

Гранты

  • Президентская государственная академическая стипендия
Личные инструменты