Участник:Evgeny smirnov
Материал из MachineLearning.
(→Отчет о научно-исследовательской работе) |
(→Отчет о научно-исследовательской работе) |
||
Строка 15: | Строка 15: | ||
'''Полувероятностная тематическая модель для задачи классификации''' | '''Полувероятностная тематическая модель для задачи классификации''' | ||
- | ''В работе строится полувероятностная тематическая модель для задачи классификации текстовых | + | ''В работе строится полувероятностная тематическая модель для задачи классификации слов в текстовых документах. Для её построения используется метод аддитивной регуляризации тематических моделей ARTM. Для него осуществлён подбор проблемно-ориентированных регуляризаторов. На основе метода предложен EM-алгоритм для решения задачи. Новизна заключается в том, что задача классификации решается используя двухматричное разложение вместо трёхматричного. Проведён эксперимент на реальных данных мобильного сервиса для изучения иностранных слов. Сделан вывод о повышении качества рекомендаций сервиса на основе построенной модели.'' |
'''Публикация''' | '''Публикация''' | ||
Смирнов Е.А. Воронцов К.В. Полувероятностная тематическая модель для задачи классификации // ''Машинное обучение и анализ данных.'' — 2015. — ISSN 2223-3792. (готовится к подаче в журнал) | Смирнов Е.А. Воронцов К.В. Полувероятностная тематическая модель для задачи классификации // ''Машинное обучение и анализ данных.'' — 2015. — ISSN 2223-3792. (готовится к подаче в журнал) | ||
<big> | <big> |
Версия 21:11, 4 сентября 2015
МФТИ, ФУПМ
Кафедра «Интеллектуальные системы»
Направление «Интеллектуальный анализ данных»
evgenii.smirnov@phystech.edu
Отчет о научно-исследовательской работе
Весна 2015, 6-й семестр
Полувероятностная тематическая модель для задачи классификации
В работе строится полувероятностная тематическая модель для задачи классификации слов в текстовых документах. Для её построения используется метод аддитивной регуляризации тематических моделей ARTM. Для него осуществлён подбор проблемно-ориентированных регуляризаторов. На основе метода предложен EM-алгоритм для решения задачи. Новизна заключается в том, что задача классификации решается используя двухматричное разложение вместо трёхматричного. Проведён эксперимент на реальных данных мобильного сервиса для изучения иностранных слов. Сделан вывод о повышении качества рекомендаций сервиса на основе построенной модели.
Публикация Смирнов Е.А. Воронцов К.В. Полувероятностная тематическая модель для задачи классификации // Машинное обучение и анализ данных. — 2015. — ISSN 2223-3792. (готовится к подаче в журнал)