Участник:Aplavin
Материал из MachineLearning.
Плавин Александр Викторович
МФТИ, ФУПМ, 174
Кафедра "Интеллектуальные системы"
Сайт plav.in
E-mail alexander@plav.in
Содержание |
Научно-исследовательская работа
Весна 2014, 6 семестр
Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания
В работе исследуется возможность автоматического определения оптимального числа тем вероятностной тематической модели. В рамках подхода аддитивной регуляризации тематических моделей предлагается регуляризатор строкового разреживания, позволяющий постепенно сокращать число тем с избыточного начального приближения до оптимального значения. Проводятся вычислительные эксперименты на реалистичных модельных данных, иллюстрирующие устойчивое определение истинного числа тем в модели.
Осень 2014, 7 семестр
Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания
Проведены исследования энтропийной регуляризации (строкового разреживания) для определения числа тем в коллекции и самих этих тем. Вычислительные эксперименты на модельных и реальных данных подтверждают теоретические ожидания: определение числа тем на самом деле происходит, линейно-зависимые темы удаляются первыми.
Публикации
А.В.Плавин Text Structure Visualization by Topic Modeling, Технический отчёт // Сервер вычислительных экспериментов mvr.jmlda.org (дата обращения: 30.12.2014).
А.В.Плавин Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания // 57-я международная научная конференция МФТИ.
Весна 2015, 8 семестр
Отбор тем в задачах тематического моделирования
В данной работе предлагается метод определения оптимального числа тем в вероятностных тематических моделях, основанный на постепенном отборе тем. Используется подход аддитивной регуляризации тематических моделей, отбор тем в котором производится с помощью энтропийного регуляризатора. Поведение предлагаемого метода исследуется как с теоретической точки зрения, так и путём вычислительных экспериментов с использованием реальных текстовых коллекций. Показывается, что он действительно позволяет определять число тем, получаемые результаты устойчивы с нескольких точек зрения, а реализация метода вычислительно эффективна.
Бакалаврская диссертация
А.В.Плавин Отбор тем в задачах тематического моделирования // Готовится к подаче в JMLDA.
Публикации
Konstantin Vorontsov, Anna Potapenko, Alexander Plavin Additive Regularization of Topic Models for Topic Selection and Sparse Factorization, pdf // The Third International Symposium on Learning and Data Sciences (SLDS 2015), апрель
А.В.Плавин Отбор тем в вероятностных тематических моделях // Конференция "Ломоносов-2015", апрель
Осень 2015, 9 семестр
Энтропийный регуляризатор отбора тем в вероятностных тематических моделях
В задачах машинного обучения важным элементом является определение структуры модели. В задачах регрессии и класси- фикации структурный параметр — это мощность оптимального подмножества признаков, в задачах кластеризации — число кла- стеров, в задачах матричного разложения — промежуточная раз- мерность матриц или число главных компонент. В данной работе рассматриваются методы обучения вероятностных тематических моделей коллекций текстовых документов, и в качестве струк- турного параметра выступает число тем. От выбора числа тем зависят такие характеристики качества тем, как интерпретируе- мость, согласованность, различность. В работе предлагается использовать энтропийный регуляриза- тор, который на каждой итерации обучения модели отбрасывает наименее значимые темы. Это позволяет верно определять зара- нее известное число тем для синтетических коллекций. Однако на реальных данных чётко определить оптимальное число тем, как правило не удаётся. Тем не менее, энтропийный регуляри- затор даёт более устойчивые значения числа тем, как в рамках одного запуска, так и при нескольких запусках из различных на- чальных приближений, по сравнению с моделью иерархического процесса Дирихле, обычно используемого для определения числа тем. Энтропийный регуляризатор имеет значимые преимущества в скорости вычислений, свободно сочетается с другими аддитив- ными регуляризаторами, и обладает свойством удалять в первую очередь линейно зависимые и расщеплённые темы, что способ- ствует повышению интерпретируемости модели.
Публикации
А.В.Плавин Энтропийный регуляризатор отбора тем в вероятностных тематических моделях // ММРО-17, сентябрь
Весна 2016, 10 семестр
Survey and variability study of the core shift effect in AGN jets
The observed position of the core in radio jets of active galactic nuclei changes with the observing frequency because of synchrotron self-absorption and external absorption. Measuring this shift allows to reconstruct geometry of the jet base, probe physical conditions close to the core and determine the core position itself more accurately. We performed successful measurements for more than 1000 quasars observed with VLBI at two frequencies (2.3 and 8.4 GHz) at different observing epochs. The core shift was measured by aligning the corresponding images using masked 2D cross-correlation and finding the core component position by model-fitting the calibrated visibility data. The method employed is semi-automatic, which delivers more robust and unbiased results. Results of the core-shift variability analysis for selected targets as well as changes of geometrical and physical parameters of their cores will be presented and discussed.
Публикации
Alexander Plavin Variability of the core shift effect in AGN jets // 13th European VLBI Network Symposium, September (принят доклад; статья в процессе подготовки)