Участник:Yegor.Budnikov

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: __NOTOC__ '''МФТИ, ФУПМ''' Кафедра "'''Интеллектуальные системы'''" Направление "'''Интеллектуальный анализ да...)
(Осень 2012, 9-й семестр)
 
(4 промежуточные версии не показаны)
Строка 34: Строка 34:
''В работе производится обзор и сравнение следующих моделей натурального
''В работе производится обзор и сравнение следующих моделей натурального
-
языка: $n$-граммы, $n$-граммы на классах, дисконтная модель.
+
языка: <tex>n</tex>-граммы, <tex>n</tex>-граммы на классах, дисконтная модель.
В первой части работы проводится обзор основной литературы по
В первой части работы проводится обзор основной литературы по
Строка 51: Строка 51:
|страницы = 245-250
|страницы = 245-250
|url = https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Budnikov2011Statistical/docs/Budnikov11Statistical.pdf
|url = https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Budnikov2011Statistical/docs/Budnikov11Statistical.pdf
-
}}
+
}}
=== Весна 2012, 8-й семестр ===
=== Весна 2012, 8-й семестр ===
'''Оценивание вероятностей появления строк в естественном языке'''
'''Оценивание вероятностей появления строк в естественном языке'''
-
''В работе рассматривается задача оценивания вероятностей появления строк в естественном языке. Для решения задачи используется модель $n$-грамм. Для решения проблемы большого числа параметров предлагается использовать модель $n$-грамм на классах. Для решения проблемы нулевых вероятностей строк предлагается использовать три дисконтные модели: Гуда-Тьюринга, Катца и абсолютного дисконтирования.
+
''В работе рассматривается задача оценивания вероятностей появления строк в естественном языке. Для решения задачи используется модель <tex>n</tex>-грамм. Для решения проблемы большого числа параметров предлагается использовать модель <tex>n</tex>-грамм на классах. Для решения проблемы нулевых вероятностей строк предлагается использовать три дисконтные модели: Гуда-Тьюринга, Катца и абсолютного дисконтирования.
-
Вводятся основные определения и описываются методы, а также алгоритм построения классов в модели $n$-грамм на классах. Описывается проведённый эксперимент на синтетических данных.''
+
Вводятся основные определения и описываются методы, а также алгоритм построения классов в модели <tex>n</tex>-грамм на классах. Описывается проведённый эксперимент на синтетических данных.''
'''Публикации'''
'''Публикации'''
Строка 65: Строка 65:
|название = Оценивание вероятностей появления строк в естественном языке
|название = Оценивание вероятностей появления строк в естественном языке
|журнал = Машинное обучение и анализ данных
|журнал = Машинное обучение и анализ данных
-
|год = 2011
+
|год = 2012
|номер = 3
|номер = 3
|ISSN = 2223-3792
|ISSN = 2223-3792
Строка 71: Строка 71:
|страницы = 376-386
|страницы = 376-386
|url = https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Budnikov2012StringsProbabilities/docs/Budnikov2012StringsProbabilities.pdf
|url = https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Budnikov2012StringsProbabilities/docs/Budnikov2012StringsProbabilities.pdf
 +
}}
 +
 +
'''Гранты'''
 +
*Президентская государственная академическая стипендия
 +
 +
 +
=== Осень 2012, 9-й семестр ===
 +
'''Оценивание вероятностей появления строк в коллекции документов'''
 +
 +
''В работе рассматривается задача оценивания вероятностей появления строк в документах. Для решения задачи используется модель n-грамм. Для решения проблемы большого числа параметров предлагается использовать модель n-грамм на классах. Для решения проблемы нулевых вероятностей появления строк используется три дисконтные
 +
модели: Гуда-Тьюринга, Катца и абсолютного дисконтирования. Описывается проведённый эксперимент на синтетических данных. Предлагаемая модель проиллюстрирована вычислительным экспериментом на реальных данных.''
 +
 +
'''Публикации'''
 +
*{{Статья
 +
|автор = Будников Е.А., Стрижов В.В.
 +
|название = Оценивание вероятностей появления строк в коллекции документов
 +
}}
 +
 +
Работа над статьёй '''Определение границ дорожек печатных плат на изображениях с помощью одноклассовой классификации'''
 +
 +
''Рассматривается задача определения границ дорожек печатных плат на изображениях. Решать задачу предлагается с помощью одноклассовой классификации. Для этого строится вероятностная модель описания множества граничных пикселей. Показывается, что эта модель является обобщением модели Такса, построенной из чисто эвристических предположений. Также предлагается использовать <tex>L_1</tex>-регуляризацию признаков.''
 +
 +
'''Публикации'''
 +
*{{Статья
 +
|автор = Будников Е.А., Романенко А.А
 +
|название = Определение границ дорожек печатных плат на изображениях с помощью одноклассовой классификации
}}
}}
'''Гранты'''
'''Гранты'''
*Президентская государственная академическая стипендия
*Президентская государственная академическая стипендия

Текущая версия

МФТИ, ФУПМ

Кафедра "Интеллектуальные системы"

Направление "Интеллектуальный анализ данных"

Mailto: yegor.budnikov@gmail.com

Отчеты о научно-исследовательской работе

Весна 2011, 6-й семестр

Прогнозирование функциями дискретного аргумента

В работе исследуются короткие временные ряды на примере монофонических музыкальных мелодий. Происходит прогнозирование одной ноты экспоненциальным сглаживанием, локальным методом, а также методом поиска постоянных закономерностей.

Вычислительный эксперимент проводится на двух мелодиях, одна из которых имеет точно повторяющиеся фрагменты.

Публикация

Осень 2011, 7-й семестр

Обзор некоторых статистических моделей естественных языков

В работе производится обзор и сравнение следующих моделей натурального языка: n-граммы, n-граммы на классах, дисконтная модель.

В первой части работы проводится обзор основной литературы по данной тематике, во второй части вводятся основные понятия и описываются сами методы.

Публикации

Весна 2012, 8-й семестр

Оценивание вероятностей появления строк в естественном языке

В работе рассматривается задача оценивания вероятностей появления строк в естественном языке. Для решения задачи используется модель n-грамм. Для решения проблемы большого числа параметров предлагается использовать модель n-грамм на классах. Для решения проблемы нулевых вероятностей строк предлагается использовать три дисконтные модели: Гуда-Тьюринга, Катца и абсолютного дисконтирования.

Вводятся основные определения и описываются методы, а также алгоритм построения классов в модели n-грамм на классах. Описывается проведённый эксперимент на синтетических данных.

Публикации

Гранты

  • Президентская государственная академическая стипендия


Осень 2012, 9-й семестр

Оценивание вероятностей появления строк в коллекции документов

В работе рассматривается задача оценивания вероятностей появления строк в документах. Для решения задачи используется модель n-грамм. Для решения проблемы большого числа параметров предлагается использовать модель n-грамм на классах. Для решения проблемы нулевых вероятностей появления строк используется три дисконтные модели: Гуда-Тьюринга, Катца и абсолютного дисконтирования. Описывается проведённый эксперимент на синтетических данных. Предлагаемая модель проиллюстрирована вычислительным экспериментом на реальных данных.

Публикации

  • Будников Е.А., Стрижов В.В. Оценивание вероятностей появления строк в коллекции документов. — {{{год}}}.

Работа над статьёй Определение границ дорожек печатных плат на изображениях с помощью одноклассовой классификации

Рассматривается задача определения границ дорожек печатных плат на изображениях. Решать задачу предлагается с помощью одноклассовой классификации. Для этого строится вероятностная модель описания множества граничных пикселей. Показывается, что эта модель является обобщением модели Такса, построенной из чисто эвристических предположений. Также предлагается использовать L_1-регуляризацию признаков.

Публикации

  • Будников Е.А., Романенко А.А Определение границ дорожек печатных плат на изображениях с помощью одноклассовой классификации. — {{{год}}}.

Гранты

  • Президентская государственная академическая стипендия
Личные инструменты