Участник:Yegor.Budnikov
Материал из MachineLearning.
(Новая: __NOTOC__ '''МФТИ, ФУПМ''' Кафедра "'''Интеллектуальные системы'''" Направление "'''Интеллектуальный анализ да...) |
(→Осень 2012, 9-й семестр) |
||
(4 промежуточные версии не показаны) | |||
Строка 34: | Строка 34: | ||
''В работе производится обзор и сравнение следующих моделей натурального | ''В работе производится обзор и сравнение следующих моделей натурального | ||
- | языка: | + | языка: <tex>n</tex>-граммы, <tex>n</tex>-граммы на классах, дисконтная модель. |
В первой части работы проводится обзор основной литературы по | В первой части работы проводится обзор основной литературы по | ||
Строка 51: | Строка 51: | ||
|страницы = 245-250 | |страницы = 245-250 | ||
|url = https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Budnikov2011Statistical/docs/Budnikov11Statistical.pdf | |url = https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Budnikov2011Statistical/docs/Budnikov11Statistical.pdf | ||
- | }} | + | }} |
=== Весна 2012, 8-й семестр === | === Весна 2012, 8-й семестр === | ||
'''Оценивание вероятностей появления строк в естественном языке''' | '''Оценивание вероятностей появления строк в естественном языке''' | ||
- | ''В работе рассматривается задача оценивания вероятностей появления строк в естественном языке. Для решения задачи используется модель | + | ''В работе рассматривается задача оценивания вероятностей появления строк в естественном языке. Для решения задачи используется модель <tex>n</tex>-грамм. Для решения проблемы большого числа параметров предлагается использовать модель <tex>n</tex>-грамм на классах. Для решения проблемы нулевых вероятностей строк предлагается использовать три дисконтные модели: Гуда-Тьюринга, Катца и абсолютного дисконтирования. |
- | Вводятся основные определения и описываются методы, а также алгоритм построения классов в модели | + | Вводятся основные определения и описываются методы, а также алгоритм построения классов в модели <tex>n</tex>-грамм на классах. Описывается проведённый эксперимент на синтетических данных.'' |
'''Публикации''' | '''Публикации''' | ||
Строка 65: | Строка 65: | ||
|название = Оценивание вероятностей появления строк в естественном языке | |название = Оценивание вероятностей появления строк в естественном языке | ||
|журнал = Машинное обучение и анализ данных | |журнал = Машинное обучение и анализ данных | ||
- | |год = | + | |год = 2012 |
|номер = 3 | |номер = 3 | ||
|ISSN = 2223-3792 | |ISSN = 2223-3792 | ||
Строка 71: | Строка 71: | ||
|страницы = 376-386 | |страницы = 376-386 | ||
|url = https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Budnikov2012StringsProbabilities/docs/Budnikov2012StringsProbabilities.pdf | |url = https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Budnikov2012StringsProbabilities/docs/Budnikov2012StringsProbabilities.pdf | ||
+ | }} | ||
+ | |||
+ | '''Гранты''' | ||
+ | *Президентская государственная академическая стипендия | ||
+ | |||
+ | |||
+ | === Осень 2012, 9-й семестр === | ||
+ | '''Оценивание вероятностей появления строк в коллекции документов''' | ||
+ | |||
+ | ''В работе рассматривается задача оценивания вероятностей появления строк в документах. Для решения задачи используется модель n-грамм. Для решения проблемы большого числа параметров предлагается использовать модель n-грамм на классах. Для решения проблемы нулевых вероятностей появления строк используется три дисконтные | ||
+ | модели: Гуда-Тьюринга, Катца и абсолютного дисконтирования. Описывается проведённый эксперимент на синтетических данных. Предлагаемая модель проиллюстрирована вычислительным экспериментом на реальных данных.'' | ||
+ | |||
+ | '''Публикации''' | ||
+ | *{{Статья | ||
+ | |автор = Будников Е.А., Стрижов В.В. | ||
+ | |название = Оценивание вероятностей появления строк в коллекции документов | ||
+ | }} | ||
+ | |||
+ | Работа над статьёй '''Определение границ дорожек печатных плат на изображениях с помощью одноклассовой классификации''' | ||
+ | |||
+ | ''Рассматривается задача определения границ дорожек печатных плат на изображениях. Решать задачу предлагается с помощью одноклассовой классификации. Для этого строится вероятностная модель описания множества граничных пикселей. Показывается, что эта модель является обобщением модели Такса, построенной из чисто эвристических предположений. Также предлагается использовать <tex>L_1</tex>-регуляризацию признаков.'' | ||
+ | |||
+ | '''Публикации''' | ||
+ | *{{Статья | ||
+ | |автор = Будников Е.А., Романенко А.А | ||
+ | |название = Определение границ дорожек печатных плат на изображениях с помощью одноклассовой классификации | ||
}} | }} | ||
'''Гранты''' | '''Гранты''' | ||
*Президентская государственная академическая стипендия | *Президентская государственная академическая стипендия |
Текущая версия
МФТИ, ФУПМ
Кафедра "Интеллектуальные системы"
Направление "Интеллектуальный анализ данных"
Mailto: yegor.budnikov@gmail.com
Отчеты о научно-исследовательской работе
Весна 2011, 6-й семестр
Прогнозирование функциями дискретного аргумента
В работе исследуются короткие временные ряды на примере монофонических музыкальных мелодий. Происходит прогнозирование одной ноты экспоненциальным сглаживанием, локальным методом, а также методом поиска постоянных закономерностей.
Вычислительный эксперимент проводится на двух мелодиях, одна из которых имеет точно повторяющиеся фрагменты.
Публикация
- Будников Е.А. Прогнозирование функциями дискретного аргумента // Машинное обучение и анализ данных. — 2011. — № 1. — С. 85-91. — ISSN 2223-3792.
Осень 2011, 7-й семестр
Обзор некоторых статистических моделей естественных языков
В работе производится обзор и сравнение следующих моделей натурального языка: -граммы, -граммы на классах, дисконтная модель.
В первой части работы проводится обзор основной литературы по данной тематике, во второй части вводятся основные понятия и описываются сами методы.
Публикации
- Будников Е.А. Обзор некоторых статистических моделей естественных языков // Машинное обучение и анализ данных. — 2011. — № 2. — С. 245-250. — ISSN 2223-3792.
Весна 2012, 8-й семестр
Оценивание вероятностей появления строк в естественном языке
В работе рассматривается задача оценивания вероятностей появления строк в естественном языке. Для решения задачи используется модель -грамм. Для решения проблемы большого числа параметров предлагается использовать модель -грамм на классах. Для решения проблемы нулевых вероятностей строк предлагается использовать три дисконтные модели: Гуда-Тьюринга, Катца и абсолютного дисконтирования.
Вводятся основные определения и описываются методы, а также алгоритм построения классов в модели -грамм на классах. Описывается проведённый эксперимент на синтетических данных.
Публикации
- Будников Е.А. Оценивание вероятностей появления строк в естественном языке // Машинное обучение и анализ данных. — 2012. — № 3. — С. 376-386. — ISSN 2223-3792.
Гранты
- Президентская государственная академическая стипендия
Осень 2012, 9-й семестр
Оценивание вероятностей появления строк в коллекции документов
В работе рассматривается задача оценивания вероятностей появления строк в документах. Для решения задачи используется модель n-грамм. Для решения проблемы большого числа параметров предлагается использовать модель n-грамм на классах. Для решения проблемы нулевых вероятностей появления строк используется три дисконтные модели: Гуда-Тьюринга, Катца и абсолютного дисконтирования. Описывается проведённый эксперимент на синтетических данных. Предлагаемая модель проиллюстрирована вычислительным экспериментом на реальных данных.
Публикации
- Будников Е.А., Стрижов В.В. Оценивание вероятностей появления строк в коллекции документов. — {{{год}}}.
Работа над статьёй Определение границ дорожек печатных плат на изображениях с помощью одноклассовой классификации
Рассматривается задача определения границ дорожек печатных плат на изображениях. Решать задачу предлагается с помощью одноклассовой классификации. Для этого строится вероятностная модель описания множества граничных пикселей. Показывается, что эта модель является обобщением модели Такса, построенной из чисто эвристических предположений. Также предлагается использовать -регуляризацию признаков.
Публикации
- Будников Е.А., Романенко А.А Определение границ дорожек печатных плат на изображениях с помощью одноклассовой классификации. — {{{год}}}.
Гранты
- Президентская государственная академическая стипендия