Участник:Aplavin

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Публикации)
Строка 29: Строка 29:
=== Публикации ===
=== Публикации ===
 +
 +
''А.В.Плавин'' [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Plavin2014TopicModelVisualization/doc/Plavin2014Systemdocs.doc?format=raw Text Structure Visualization by Topic Modeling], Технический отчёт // ''Сервер вычислительных экспериментов mvr.jmlda.org'' (дата обращения: 30.12.2014).
''А.В.Плавин'' Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания // ''57-я международная научная конференция МФТИ.''
''А.В.Плавин'' Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания // ''57-я международная научная конференция МФТИ.''
 +
''Konstantin Vorontsov, Anna Potapenko, Alexander Plavin'' Additive Regularization of Topic Models for Topic Selection and Sparse Factorization // ''The Third International Symposium on Learning and Data Sciences (SLDS 2015)'' (принято)
''Konstantin Vorontsov, Anna Potapenko, Alexander Plavin'' Additive Regularization of Topic Models for Topic Selection and Sparse Factorization // ''The Third International Symposium on Learning and Data Sciences (SLDS 2015)'' (принято)

Версия 00:40, 29 января 2015

Плавин Александр Викторович

МФТИ, ФУПМ, 174

Кафедра "Интеллектуальные системы"

Сайт plav.in

E-mail alexander@plav.in


Содержание

Научно-исследовательская работа

Весна 2014, 6 семестр

Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания

В работе исследуется возможность автоматического определения оптимального числа тем вероятностной тематической модели. В рамках подхода аддитивной регуляризации тематических моделей предлагается регуляризатор строкового разреживания, позволяющий постепенно сокращать число тем с избыточного начального приближения до оптимального значения. Проводятся вычислительные эксперименты на реалистичных модельных данных, иллюстрирующие устойчивое определение истинного числа тем в модели.

Папка в репозитории


Осень 2014, 7 семестр

Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания

Проведены исследования энтропийной регуляризации (строкового разреживания) для определения числа тем в коллекции и самих этих тем. Вычислительные эксперименты на модельных и реальных данных подтверждают теоретические ожидания: определение числа тем на самом деле происходит, линейно-зависимые темы удаляются первыми.

Публикации

А.В.Плавин Text Structure Visualization by Topic Modeling, Технический отчёт // Сервер вычислительных экспериментов mvr.jmlda.org (дата обращения: 30.12.2014).

А.В.Плавин Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания // 57-я международная научная конференция МФТИ.

Konstantin Vorontsov, Anna Potapenko, Alexander Plavin Additive Regularization of Topic Models for Topic Selection and Sparse Factorization // The Third International Symposium on Learning and Data Sciences (SLDS 2015) (принято)

Личные инструменты