Участник:Aplavin
Материал из MachineLearning.
Строка 34: | Строка 34: | ||
''А.В.Плавин'' Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания // ''57-я международная научная конференция МФТИ.'' | ''А.В.Плавин'' Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания // ''57-я международная научная конференция МФТИ.'' | ||
- | ''Konstantin Vorontsov, Anna Potapenko, Alexander Plavin'' Additive Regularization of Topic Models for Topic Selection and Sparse Factorization // ''The Third International Symposium on Learning and Data Sciences (SLDS 2015)'' (принято) | + | |
+ | |||
+ | == Весна 2015, 8 семестр == | ||
+ | |||
+ | === Отбор тем в задачах тематического моделирования === | ||
+ | |||
+ | В данной работе предлагается метод определения оптимального числа тем в вероятностных тематических моделях, основанный на постепенном отборе тем. Используется подход аддитивной регуляризации тематических моделей, отбор тем в котором производится с помощью энтропийного регуляризатора. Поведение предлагаемого метода исследуется как с теоретической точки зрения, так и путём вычислительных экспериментов с использованием реальных текстовых коллекций. Показывается, что он действительно позволяет определять число тем, получаемые результаты устойчивы с нескольких точек зрения, а реализация метода вычислительно эффективна. | ||
+ | |||
+ | === Бакалаврская диссертация === | ||
+ | |||
+ | ''А.В.Плавин'' [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Plavin2015TopicSelection/doc/Plavin2015Diploma.pdf Отбор тем в задачах тематического моделирования] // ''Готовится к подаче в JMLDA.'' | ||
+ | |||
+ | === Публикации === | ||
+ | |||
+ | ''Konstantin Vorontsov, Anna Potapenko, Alexander Plavin'' [http://link.springer.com/chapter/10.1007%2F978-3-319-17091-6_14 Additive Regularization of Topic Models for Topic Selection and Sparse Factorization], [http://www.machinelearning.ru/wiki/images/e/e3/Voron15slds.pdf pdf] // ''The Third International Symposium on Learning and Data Sciences (SLDS 2015), апрель'' | ||
+ | |||
+ | ''А.В.Плавин'' [http://lomonosov-msu.ru/archive/Lomonosov_2015/data/7087/uid87341_bae3db21889eadf45e7d7a52b20ac40bfb7c3041.pdf Отбор тем в вероятностных тематических моделях] // ''Конференция "Ломоносов-2015", апрель'' | ||
+ | |||
+ | ''А.В.Плавин'' Энтропийный регуляризатор отбора тем в вероятностных тематических моделях // ''ММРО-17, сентябрь (принято к публикации)'' |
Версия 17:52, 23 августа 2015
Плавин Александр Викторович
МФТИ, ФУПМ, 174
Кафедра "Интеллектуальные системы"
Сайт plav.in
E-mail alexander@plav.in
Содержание |
Научно-исследовательская работа
Весна 2014, 6 семестр
Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания
В работе исследуется возможность автоматического определения оптимального числа тем вероятностной тематической модели. В рамках подхода аддитивной регуляризации тематических моделей предлагается регуляризатор строкового разреживания, позволяющий постепенно сокращать число тем с избыточного начального приближения до оптимального значения. Проводятся вычислительные эксперименты на реалистичных модельных данных, иллюстрирующие устойчивое определение истинного числа тем в модели.
Осень 2014, 7 семестр
Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания
Проведены исследования энтропийной регуляризации (строкового разреживания) для определения числа тем в коллекции и самих этих тем. Вычислительные эксперименты на модельных и реальных данных подтверждают теоретические ожидания: определение числа тем на самом деле происходит, линейно-зависимые темы удаляются первыми.
Публикации
А.В.Плавин Text Structure Visualization by Topic Modeling, Технический отчёт // Сервер вычислительных экспериментов mvr.jmlda.org (дата обращения: 30.12.2014).
А.В.Плавин Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания // 57-я международная научная конференция МФТИ.
Весна 2015, 8 семестр
Отбор тем в задачах тематического моделирования
В данной работе предлагается метод определения оптимального числа тем в вероятностных тематических моделях, основанный на постепенном отборе тем. Используется подход аддитивной регуляризации тематических моделей, отбор тем в котором производится с помощью энтропийного регуляризатора. Поведение предлагаемого метода исследуется как с теоретической точки зрения, так и путём вычислительных экспериментов с использованием реальных текстовых коллекций. Показывается, что он действительно позволяет определять число тем, получаемые результаты устойчивы с нескольких точек зрения, а реализация метода вычислительно эффективна.
Бакалаврская диссертация
А.В.Плавин Отбор тем в задачах тематического моделирования // Готовится к подаче в JMLDA.
Публикации
Konstantin Vorontsov, Anna Potapenko, Alexander Plavin Additive Regularization of Topic Models for Topic Selection and Sparse Factorization, pdf // The Third International Symposium on Learning and Data Sciences (SLDS 2015), апрель
А.В.Плавин Отбор тем в вероятностных тематических моделях // Конференция "Ломоносов-2015", апрель
А.В.Плавин Энтропийный регуляризатор отбора тем в вероятностных тематических моделях // ММРО-17, сентябрь (принято к публикации)