Участник:Evgeny smirnov

Материал из MachineLearning.

Перейти к: навигация, поиск

МФТИ, ФУПМ

Кафедра «Интеллектуальные системы»

Направление «Интеллектуальный анализ данных»

evgenii.smirnov@phystech.edu

Отчет о научно-исследовательской работе

Весна 2015, 6-й семестр


Полувероятностная тематическая модель для задачи классификации

В работе строится полувероятностная тематическая модель для задачи классификации слов в текстовых документах. Для её построения используется метод аддитивной регуляризации тематических моделей ARTM. Для него осуществлён подбор проблемно-ориентированных регуляризаторов. На основе метода предложен EM-алгоритм для решения задачи. Новизна заключается в том, что задача классификации решается используя двухматричное разложение вместо трёхматричного. Проведён эксперимент на реальных данных мобильного сервиса для изучения иностранных слов. Сделан вывод о повышении качества рекомендаций сервиса на основе построенной модели.

Публикация Смирнов Е.А. Воронцов К.В. Полувероятностная тематическая модель для задачи классификации // Машинное обучение и анализ данных. — 2015. — ISSN 2223-3792. (готовится к подаче в журнал)

Личные инструменты