Участник:Katrutsa

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Осень 2013, 7-й семестр)
(Весна 2013, 6-й семестр)
Строка 16: Строка 16:
'''Публикация'''
'''Публикация'''
-
''А. М. Катруца, М.П.Кузнецов, В.В. Стрижов, К.В. Рудаков'' [http://svn.code.sf.net/p/mlalgorithms/code/Katrutsa2013RhoNets/Summer/comb_text.pdf Rho-net: быстрый алгоритм кластеризации с использованием матрицы парных расстояний в ранговых шкалах] // JCAM
+
''A. M. Katrutsa, M. P. Kuznetsov, V. V. Strijov, K. V. Rudakov А. М. Катруца, М.П.Кузнецов, В.В. Стрижов, К.В. Рудаков'' [http://svn.code.sf.net/p/mlalgorithms/code/RhoNetClustering/doc/Clustering2013/RhoNetClusteringIDA.pdf Metric concentration search procedure using reduced matrix of pairwise distances] // [http://www.iospress.nl/journal/intelligent-data-analysis/ Intelligent Data Analysis]. - 2015. - Vol. 19. - N. 5.
-
Предложен алгоритм ранговой кластеризации, основанный на построении <tex>$\rho$</tex>-сети
+
This paper presents a new fast clustering algorithm RhoNet, based on the metric concenration location procedure. To locate the metric concentration, the algorithm uses a reduced matrix of pairwise ranks distances. The key feature of the proposed algorithm is that it doesn’t need the exhaustive matrix of pairwise distances. This feature reduces computational complexity. It is designed to solve the protein secondary structure recognition problem. The computational experiment collects tests and to hold performance analysis and analysis of dependency for the algorithm quality and structure parameters. The algorithm is compared with k-modes and tested on different metrics and data sets.
-
и нахождения метрических сгущений. При кластеризации рассматриваются только ранги расстояний между подпоследовательностями. Для выявления кластеров
+
-
используются парные расстояния между подпоследовательностями. Отличительной
+
-
особенностью исследуемого алгоритма является то, что не требуется строить полную
+
-
матрицу парных расстояний, что снижает его сложность. Алгоритм предназначен для
+
-
решения задачи распознавания вторичной структуры белков и кластеризации подпоследовательности аминокислотных остатков. Работа алгоритма проиллюстрирована
+
-
синтетическими данными и данными из базы UniProt. Предложен набор тестов и про-
+
-
анализирована зависимость качества работы рангового алгоритма кластеризации от
+
-
параметров. Проведено сравнение предложенного алгоритма с известными на различных выборках. Алгоритмы тестировались на модельных данных и реальных данных
+
-
из репозитория UCI.
+
=== Осень 2013, 7-й семестр ===
=== Осень 2013, 7-й семестр ===

Версия 16:36, 21 июля 2014

Катруца Александр Михайлович

МФТИ, ФУПМ, группа 074

Кафедра "Интеллектуальные системы"

Направление "Интеллектуальный анализ данных"

amkatrutsa@yandex.ru


Отчеты о научно-исследовательской работе

Весна 2013, 6-й семестр

Публикация

A. M. Katrutsa, M. P. Kuznetsov, V. V. Strijov, K. V. Rudakov А. М. Катруца, М.П.Кузнецов, В.В. Стрижов, К.В. Рудаков Metric concentration search procedure using reduced matrix of pairwise distances // Intelligent Data Analysis. - 2015. - Vol. 19. - N. 5.

This paper presents a new fast clustering algorithm RhoNet, based on the metric concenration location procedure. To locate the metric concentration, the algorithm uses a reduced matrix of pairwise ranks distances. The key feature of the proposed algorithm is that it doesn’t need the exhaustive matrix of pairwise distances. This feature reduces computational complexity. It is designed to solve the protein secondary structure recognition problem. The computational experiment collects tests and to hold performance analysis and analysis of dependency for the algorithm quality and structure parameters. The algorithm is compared with k-modes and tested on different metrics and data sets.

Осень 2013, 7-й семестр

Ранжирование поисковой выдачи.

Требуется по данному множеству запросов и документов отранжировать документы, соответствующие одному запросу по степени релевантности. Обучающая выборка состоит из признакового описания документов, идентификатора запроса и оценки ассесора. Предлгается использовать логистическую регрессию и отбор признаков для нахождения оценок релевантности.

Публикация

А. М. Катруца Ранжирование поисковой выдачи: технический отчет // Вычислительный сервер журнала "Машинное обучение и анализ данных" [Электронный ресурс] URL: mvr.jmlda.org (дата обращения: 26.12.2013).

Выбор признаков в линейных регрессионных моделей при наличии мультиколлинеарных признаков

Рассматривается задача тестирования алгоритмов выбора признаков. Предлагается способ тестирования методов выбора признаков на синтетических данных. Алгоритмы выбора признаков сравниваются по эффективности выявления и устранения мультиколлинеарных признаков. При этом эффективность определяется различными функционалами качества. Проведена классификация видов мультиколлинеарности и взаимного расположения признаков. Будет сделан вывод об эффективности работы алгоритмов выбора признаков на данных, в которых присутствует определённый тип мультиколлинеарности или определённое взаимное расположение признаков.

Участие в конференциях

56-ая конференция МФТИ: доклад "Алгоритм нахождения метрических сгущений с использованием редуцированной матрицы парных расстояний"

Личные инструменты