Участник:Aplavin

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (6 семестр, весна 2013)
Строка 18: Строка 18:
[http://svn.code.sf.net/p/mlalgorithms/code/Group174/Plavin2014TopicsNumberOptimization/doc/ Папка в репозитории]
[http://svn.code.sf.net/p/mlalgorithms/code/Group174/Plavin2014TopicsNumberOptimization/doc/ Папка в репозитории]
 +
 +
 +
== Осень 2014, 7 семестр ==
 +
 +
=== Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания ===
 +
 +
Проведены исследования энтропийной регуляризации (строкового разреживания) для определения числа тем в коллекции и самих этих тем. Вычислительные эксперименты на модельных и реальных данных подтверждают теоретические ожидания: определение числа тем на самом деле происходит, линейно-зависимые темы удаляются первыми.
 +
 +
=== Публикации ===
 +
 +
''А.В.Плавин'' Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания // ''57-я международная научная конференция МФТИ.''
 +
''Konstantin Vorontsov, Anna Potapenko, Alexander Plavin'' Additive Regularization of Topic Models for Topic Selection and Sparse Factorization // ''The Third International Symposium on Learning and Data Sciences (SLDS 2015)''

Версия 20:48, 30 декабря 2014

Плавин Александр Викторович

МФТИ, ФУПМ, 174

Кафедра "Интеллектуальные системы"

Сайт plav.in


Содержание

Научно-исследовательская работа

Весна 2014, 6 семестр

Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания

В работе исследуется возможность автоматического определения оптимального числа тем вероятностной тематической модели. В рамках подхода аддитивной регуляризации тематических моделей предлагается регуляризатор строкового разреживания, позволяющий постепенно сокращать число тем с избыточного начального приближения до оптимального значения. Проводятся вычислительные эксперименты на реалистичных модельных данных, иллюстрирующие устойчивое определение истинного числа тем в модели.

Папка в репозитории


Осень 2014, 7 семестр

Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания

Проведены исследования энтропийной регуляризации (строкового разреживания) для определения числа тем в коллекции и самих этих тем. Вычислительные эксперименты на модельных и реальных данных подтверждают теоретические ожидания: определение числа тем на самом деле происходит, линейно-зависимые темы удаляются первыми.

Публикации

А.В.Плавин Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания // 57-я международная научная конференция МФТИ. Konstantin Vorontsov, Anna Potapenko, Alexander Plavin Additive Regularization of Topic Models for Topic Selection and Sparse Factorization // The Third International Symposium on Learning and Data Sciences (SLDS 2015)

Личные инструменты