Участник:Aplavin
Материал из MachineLearning.
м (→6 семестр, весна 2013) |
|||
Строка 18: | Строка 18: | ||
[http://svn.code.sf.net/p/mlalgorithms/code/Group174/Plavin2014TopicsNumberOptimization/doc/ Папка в репозитории] | [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Plavin2014TopicsNumberOptimization/doc/ Папка в репозитории] | ||
+ | |||
+ | |||
+ | == Осень 2014, 7 семестр == | ||
+ | |||
+ | === Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания === | ||
+ | |||
+ | Проведены исследования энтропийной регуляризации (строкового разреживания) для определения числа тем в коллекции и самих этих тем. Вычислительные эксперименты на модельных и реальных данных подтверждают теоретические ожидания: определение числа тем на самом деле происходит, линейно-зависимые темы удаляются первыми. | ||
+ | |||
+ | === Публикации === | ||
+ | |||
+ | ''А.В.Плавин'' Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания // ''57-я международная научная конференция МФТИ.'' | ||
+ | ''Konstantin Vorontsov, Anna Potapenko, Alexander Plavin'' Additive Regularization of Topic Models for Topic Selection and Sparse Factorization // ''The Third International Symposium on Learning and Data Sciences (SLDS 2015)'' |
Версия 20:48, 30 декабря 2014
Плавин Александр Викторович
МФТИ, ФУПМ, 174
Кафедра "Интеллектуальные системы"
Сайт plav.in
Содержание |
Научно-исследовательская работа
Весна 2014, 6 семестр
Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания
В работе исследуется возможность автоматического определения оптимального числа тем вероятностной тематической модели. В рамках подхода аддитивной регуляризации тематических моделей предлагается регуляризатор строкового разреживания, позволяющий постепенно сокращать число тем с избыточного начального приближения до оптимального значения. Проводятся вычислительные эксперименты на реалистичных модельных данных, иллюстрирующие устойчивое определение истинного числа тем в модели.
Осень 2014, 7 семестр
Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания
Проведены исследования энтропийной регуляризации (строкового разреживания) для определения числа тем в коллекции и самих этих тем. Вычислительные эксперименты на модельных и реальных данных подтверждают теоретические ожидания: определение числа тем на самом деле происходит, линейно-зависимые темы удаляются первыми.
Публикации
А.В.Плавин Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания // 57-я международная научная конференция МФТИ. Konstantin Vorontsov, Anna Potapenko, Alexander Plavin Additive Regularization of Topic Models for Topic Selection and Sparse Factorization // The Third International Symposium on Learning and Data Sciences (SLDS 2015)