Участник:Arsenty

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Весна 2013, 8-й семестр)
(Весна 2014, 10-й семестр)
 
(8 промежуточных версий не показаны.)
Строка 31: Строка 31:
'''Выбор признаков и оптимизация метрики при кластеризации коллекции документов.'''
'''Выбор признаков и оптимизация метрики при кластеризации коллекции документов.'''
-
''Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предложен алгоритм выбора оптимальной функции расстояния между документами. Исследуется соответствие между полученной кластеризацией документов и их экспертной классификацией. Результаты кластеризации и их соответствие экспертной тематической классификации проиллюстрированы вычислительным экспериментом на реальной коллекции документов.'''
+
''Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предложен алгоритм выбора оптимальной функции расстояния между документами. Исследуется соответствие между полученной кластеризацией документов и их экспертной классификацией. Результаты кластеризации и их соответствие экспертной тематической классификации проиллюстрированы вычислительным экспериментом на реальной коллекции документов.''
'''Публикация'''
'''Публикация'''
Строка 45: Строка 45:
|url = http://publishing.tsu.tula.ru/EstestvNauki.html
|url = http://publishing.tsu.tula.ru/EstestvNauki.html
}}
}}
 +
 +
=== Весна 2013, 8-й семестр===
 +
Выпускная квалификационная работа бакалавра [http://www.machinelearning.ru/wiki/images/2/23/Kuzmin2013Diploma.pdf ''Проверка адекватности тематических моделей коллекции документов'']
'''Проверка адекватности тематических моделей коллекции документов.'''
'''Проверка адекватности тематических моделей коллекции документов.'''
-
''Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предлагается алгоритм построения иерархической модели. Определяется степень несоответствия экспертной модели и предлагаемой. В работе сравнивается качество моделей, полученных с помощью агломеративного и дивизимного алгоритов. Визуализируются отличия полученной модели от экспертной. Предлагаемый алгоритм построения тематической модели проиллюстрирован кластеризацией коллекции тезисов конференции EURO 2012.'''
+
''Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предлагается алгоритм построения иерархической модели. Определяется степень несоответствия экспертной модели и предлагаемой. В работе сравнивается качество моделей, полученных с помощью агломеративного и дивизимного алгоритов. Визуализируются отличия полученной модели от экспертной. Предлагаемый алгоритм построения тематической модели проиллюстрирован кластеризацией коллекции тезисов конференции EURO 2012.''
'''Публикация'''
'''Публикация'''
*{{Статья
*{{Статья
|автор = А. А. Кузьмин, В. В. Стрижов
|автор = А. А. Кузьмин, В. В. Стрижов
-
|название = Проверка адекватности тематических моделейколлекции документов.
+
|название = Проверка адекватности тематических моделей коллекции документов.
|журнал = Программная инженерия.
|журнал = Программная инженерия.
|год = 2013
|год = 2013
Строка 62: Строка 65:
|url = http://novtex.ru/pi.html
|url = http://novtex.ru/pi.html
}}
}}
-
 
-
=== Весна 2013, 8-й семестр===
 
-
Выпускная квалификационная работа бакалавра [http://www.machinelearning.ru/wiki/images/2/23/Kuzmin2013Diploma.pdf ''Проверка адекватности тематических моделей коллекции документов'']
 
'''Участие в конференциях'''
'''Участие в конференциях'''
26th European Conference on Operational Research. July 1-4, 2013. Rome, Italy. "Visualization of scientific conference’s thematic model". [[Медиа:Kuzmin2013BsPresentationEURO2.pdf|Презентация]]
26th European Conference on Operational Research. July 1-4, 2013. Rome, Italy. "Visualization of scientific conference’s thematic model". [[Медиа:Kuzmin2013BsPresentationEURO2.pdf|Презентация]]
 +
 +
=== Осень 2013, 9-й семестр===
 +
'''Тематическая классификация тезисов крупной конференции с использованием экспертной модели.'''
 +
 +
''Работа посвящена определению тем, научных направлений и сессий тезисов крупной научной конференции. Рассматривается коллекция тезисов конференции с экспертной тематической моделью. Строится терминологический словарь конференции. Предлагается функция сходства двух тезисов. Методом неметрической иерархической кластеризации строится алгоритмическая модель конференции, с заданным весом учитывающая существующую экспертную модель. Выявляются несоответствия между экспертной моделью и предлагаемой. Алгоритм построения тематической модели проиллюстрирован кластеризацией коллекции тезисов конференции EURO 2013.''
 +
 +
'''Публикация'''
 +
*{{Статья
 +
|автор = А. А. Кузьмин, А. А. Адуенко, В. В. Стрижов
 +
|название = Тематическая классификация тезисов крупной конференции с использованием экспертной модели.
 +
|журнал = Информационные технологии.
 +
|год = 2014
 +
|номер =
 +
|ISSN =
 +
|язык = russian
 +
|страницы =
 +
|url = http://novtex.ru/pi.html
 +
}}
 +
 +
===Весна 2014, 10-й семестр===
 +
 +
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group974/KuzminAduenkoStrijov2013AdoptiveTextClustering/doc/TextClustering_english_5.pdf "Adaptive thematic forecasting of major conference proceedings"]
 +
 +
''Целью данной работы является построения тематической модели коллекции тезисов крупной конференции. Предлагается способ вычисления сходства двух тезисов, тезиса и группы тезисов, двух групп тезисов. Данный метод учитывает терминологический состав тезисов и информативность их терминов. Методом неметрической кластеризации строится модель конференции. В качестве начального приближения используется объединенная тематическая модель, построенная по экспертным тематическим моделям прошлых конференций. Предложенным методом строится тематическая модель для коллекции тезисов конференции EURO 2010. Полученная тематическая модель сравнивается с экспертной моделью EURO 2010. ''
 +
 +
'''Публикация'''
 +
*{{Статья
 +
|автор = А. А. Кузьмин, А. А. Адуенко, В. В. Стрижов
 +
|название = Adaptive thematic forecasting of major conference proceedings.
 +
|журнал =
 +
|год = 2014
 +
|номер =
 +
|ISSN =
 +
|язык =english
 +
|страницы =
 +
|
 +
}}
 +
 +
'''Участие в конференциях'''
 +
 +
20th Conference of the International Federation of Operational Research Societies. July 13-18, 2013.Barcelona, Spain. "Thematic classification for EURO/IFORS conference using expert model". [[Медиа:Kuzmin2014_IFORS.pdf‎|Презентация]]

Текущая версия

МФТИ, ФУПМ

Кафедра "Интеллектуальные системы"

Направление "Интеллектуальный анализ данных"

Mailto: senatormipt@gmail.ru

Отчеты о научно-исследовательской работе

Весна 2012, 6-й семестр

Многоуровневая классификация при обнаружении движения цен.

В данной работе рассматривается один из возможных методов прогнозирования, основанный на модели логистической регрессии. Предлагается способ разметки пучка временных рядов и построения матрицы объект --- признак. Алгоритм проверяется на синтетических пучках временных рядов вида зашумленных синусов и периодических трапеций. Как вариант практического применения, алгоритм тестируется на данных о потреблении электроэнергии.

Публикация

Осень 2012, 7-й семестр

Выбор признаков и оптимизация метрики при кластеризации коллекции документов.

Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предложен алгоритм выбора оптимальной функции расстояния между документами. Исследуется соответствие между полученной кластеризацией документов и их экспертной классификацией. Результаты кластеризации и их соответствие экспертной тематической классификации проиллюстрированы вычислительным экспериментом на реальной коллекции документов.

Публикация

  • А. А. Кузьмин, А. А. Адуенко, В. В. Стрижов Выбор признаков и оптимизация метрики при кластеризации коллекции документов // Известия ТулГУ.. — 2012. — № 3. — С. 119-131. — ISSN 2071-6141.

Весна 2013, 8-й семестр

Выпускная квалификационная работа бакалавра Проверка адекватности тематических моделей коллекции документов

Проверка адекватности тематических моделей коллекции документов.

Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предлагается алгоритм построения иерархической модели. Определяется степень несоответствия экспертной модели и предлагаемой. В работе сравнивается качество моделей, полученных с помощью агломеративного и дивизимного алгоритов. Визуализируются отличия полученной модели от экспертной. Предлагаемый алгоритм построения тематической модели проиллюстрирован кластеризацией коллекции тезисов конференции EURO 2012.

Публикация

  • А. А. Кузьмин, В. В. Стрижов Проверка адекватности тематических моделей коллекции документов. // Программная инженерия.. — 2013. — № 4. — С. 16-20. — ISSN 2220-3397.

Участие в конференциях

26th European Conference on Operational Research. July 1-4, 2013. Rome, Italy. "Visualization of scientific conference’s thematic model". Презентация

Осень 2013, 9-й семестр

Тематическая классификация тезисов крупной конференции с использованием экспертной модели.

Работа посвящена определению тем, научных направлений и сессий тезисов крупной научной конференции. Рассматривается коллекция тезисов конференции с экспертной тематической моделью. Строится терминологический словарь конференции. Предлагается функция сходства двух тезисов. Методом неметрической иерархической кластеризации строится алгоритмическая модель конференции, с заданным весом учитывающая существующую экспертную модель. Выявляются несоответствия между экспертной моделью и предлагаемой. Алгоритм построения тематической модели проиллюстрирован кластеризацией коллекции тезисов конференции EURO 2013.

Публикация

  • А. А. Кузьмин, А. А. Адуенко, В. В. Стрижов Тематическая классификация тезисов крупной конференции с использованием экспертной модели. // Информационные технологии.. — 2014.

Весна 2014, 10-й семестр

"Adaptive thematic forecasting of major conference proceedings"

Целью данной работы является построения тематической модели коллекции тезисов крупной конференции. Предлагается способ вычисления сходства двух тезисов, тезиса и группы тезисов, двух групп тезисов. Данный метод учитывает терминологический состав тезисов и информативность их терминов. Методом неметрической кластеризации строится модель конференции. В качестве начального приближения используется объединенная тематическая модель, построенная по экспертным тематическим моделям прошлых конференций. Предложенным методом строится тематическая модель для коллекции тезисов конференции EURO 2010. Полученная тематическая модель сравнивается с экспертной моделью EURO 2010.

Публикация

  • А. А. Кузьмин, А. А. Адуенко, В. В. Стрижов Adaptive thematic forecasting of major conference proceedings.. — 2014.

Участие в конференциях

20th Conference of the International Federation of Operational Research Societies. July 13-18, 2013.Barcelona, Spain. "Thematic classification for EURO/IFORS conference using expert model". Презентация

Личные инструменты