Участник:Arsenty
Материал из MachineLearning.
(→Отчеты о научно-исследовательской работе) |
(→Отчеты о научно-исследовательской работе) |
||
Строка 90: | Строка 90: | ||
===Весна 2014, 10-й семестр=== | ===Весна 2014, 10-й семестр=== | ||
- | + | [https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group974/KuzminAduenkoStrijov2013AdoptiveTextClustering/doc/TextClustering_english_5.pdf "Adaptive thematic forecasting of major conference proceedings"] | |
''Целью данной работы является построения тематической модели коллекции тезисов крупной конференции. Предлагается способ вычисления сходства двух тезисов, тезиса и группы тезисов, двух групп тезисов. Данный метод учитывает терминологический состав тезисов и информативность их терминов. Методом неметрической кластеризации строится модель конференции. В качестве начального приближения используется объединенная тематическая модель, построенная по экспертным тематическим моделям прошлых конференций. Предложенным методом строится тематическая модель для коллекции тезисов конференции EURO 2010. Полученная тематическая модель сравнивается с экспертной моделью EURO 2010. '' | ''Целью данной работы является построения тематической модели коллекции тезисов крупной конференции. Предлагается способ вычисления сходства двух тезисов, тезиса и группы тезисов, двух групп тезисов. Данный метод учитывает терминологический состав тезисов и информативность их терминов. Методом неметрической кластеризации строится модель конференции. В качестве начального приближения используется объединенная тематическая модель, построенная по экспертным тематическим моделям прошлых конференций. Предложенным методом строится тематическая модель для коллекции тезисов конференции EURO 2010. Полученная тематическая модель сравнивается с экспертной моделью EURO 2010. '' |
Версия 17:28, 24 августа 2014
МФТИ, ФУПМ
Кафедра "Интеллектуальные системы"
Направление "Интеллектуальный анализ данных"
Mailto: senatormipt@gmail.ru
Отчеты о научно-исследовательской работе
Весна 2012, 6-й семестр
Многоуровневая классификация при обнаружении движения цен.
В данной работе рассматривается один из возможных методов прогнозирования, основанный на модели логистической регрессии. Предлагается способ разметки пучка временных рядов и построения матрицы объект --- признак. Алгоритм проверяется на синтетических пучках временных рядов вида зашумленных синусов и периодических трапеций. Как вариант практического применения, алгоритм тестируется на данных о потреблении электроэнергии.
Публикация
- Кузьмин А.А. Многоуровневая классификация при обнаружении движения цен // Машинное обучение и анализ данных. — 2012. — № 3. — С. 318-327. — ISSN 2223-3792.
Осень 2012, 7-й семестр
Выбор признаков и оптимизация метрики при кластеризации коллекции документов.
Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предложен алгоритм выбора оптимальной функции расстояния между документами. Исследуется соответствие между полученной кластеризацией документов и их экспертной классификацией. Результаты кластеризации и их соответствие экспертной тематической классификации проиллюстрированы вычислительным экспериментом на реальной коллекции документов.
Публикация
- А. А. Кузьмин, А. А. Адуенко, В. В. Стрижов Выбор признаков и оптимизация метрики при кластеризации коллекции документов // Известия ТулГУ.. — 2012. — № 3. — С. 119-131. — ISSN 2071-6141.
Весна 2013, 8-й семестр
Выпускная квалификационная работа бакалавра Проверка адекватности тематических моделей коллекции документов
Проверка адекватности тематических моделей коллекции документов.
Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предлагается алгоритм построения иерархической модели. Определяется степень несоответствия экспертной модели и предлагаемой. В работе сравнивается качество моделей, полученных с помощью агломеративного и дивизимного алгоритов. Визуализируются отличия полученной модели от экспертной. Предлагаемый алгоритм построения тематической модели проиллюстрирован кластеризацией коллекции тезисов конференции EURO 2012.
Публикация
- А. А. Кузьмин, В. В. Стрижов Проверка адекватности тематических моделей коллекции документов. // Программная инженерия.. — 2013. — № 4. — С. 16-20. — ISSN 2220-3397.
Участие в конференциях
26th European Conference on Operational Research. July 1-4, 2013. Rome, Italy. "Visualization of scientific conference’s thematic model". Презентация
Осень 2013, 9-й семестр
Тематическая классификация тезисов крупной конференции с использованием экспертной модели.
Работа посвящена определению тем, научных направлений и сессий тезисов крупной научной конференции. Рассматривается коллекция тезисов конференции с экспертной тематической моделью. Строится терминологический словарь конференции. Предлагается функция сходства двух тезисов. Методом неметрической иерархической кластеризации строится алгоритмическая модель конференции, с заданным весом учитывающая существующую экспертную модель. Выявляются несоответствия между экспертной моделью и предлагаемой. Алгоритм построения тематической модели проиллюстрирован кластеризацией коллекции тезисов конференции EURO 2013.
Публикация
- А. А. Кузьмин, А. А. Адуенко, В. В. Стрижов Тематическая классификация тезисов крупной конференции с использованием экспертной модели. // Информационные технологии.. — 2014.
Весна 2014, 10-й семестр
"Adaptive thematic forecasting of major conference proceedings"
Целью данной работы является построения тематической модели коллекции тезисов крупной конференции. Предлагается способ вычисления сходства двух тезисов, тезиса и группы тезисов, двух групп тезисов. Данный метод учитывает терминологический состав тезисов и информативность их терминов. Методом неметрической кластеризации строится модель конференции. В качестве начального приближения используется объединенная тематическая модель, построенная по экспертным тематическим моделям прошлых конференций. Предложенным методом строится тематическая модель для коллекции тезисов конференции EURO 2010. Полученная тематическая модель сравнивается с экспертной моделью EURO 2010.
Публикация
- А. А. Кузьмин, А. А. Адуенко, В. В. Стрижов Adaptive thematic forecasting of major conference proceedings. // Information Retrieval.. — 2014.
Участие в конференциях
20th Conference of the International Federation of Operational Research Societies. July 13-18, 2013.Barcelona, Spain. "Thematic classification for EURO/IFORS conference using expert model". Презентация
Категории: Кузьмин А.А. (публикации) | 2012 (публикации) | Машинное обучение и анализ данных (статьи) | А. А. Кузьмин, А. А. Адуенко, В. В. Стрижов (публикации) | Известия ТулГУ. (статьи) | А. А. Кузьмин, В. В. Стрижов (публикации) | 2013 (публикации) | Программная инженерия. (статьи) | 2014 (публикации) | Информационные технологии. (статьи) | Information Retrieval. (статьи)