Участник:Katrutsa
Материал из MachineLearning.
(→Весна 2013, 6-й семестр) |
(→Весна 2013, 6-й семестр) |
||
Строка 17: | Строка 17: | ||
''А. М. Катруца, М.П.Кузнецов, В.В. Стрижов, К.В. Рудаков'' [http://svn.code.sf.net/p/mlalgorithms/code/Katrutsa2013RhoNets/Summer/comb_text.pdf Rho-net: быстрый алгоритм кластеризации с использованием матрицы парных расстояний в ранговых шкалах] // JCAM | ''А. М. Катруца, М.П.Кузнецов, В.В. Стрижов, К.В. Рудаков'' [http://svn.code.sf.net/p/mlalgorithms/code/Katrutsa2013RhoNets/Summer/comb_text.pdf Rho-net: быстрый алгоритм кластеризации с использованием матрицы парных расстояний в ранговых шкалах] // JCAM | ||
+ | |||
Предложен алгоритм ранговой кластеризации, основанный на построении <math>$\rho$</math>-сети | Предложен алгоритм ранговой кластеризации, основанный на построении <math>$\rho$</math>-сети | ||
и нахождения метрических сгущений. При кластеризации рассматриваются только ранги расстояний между подпоследовательностями. Для выявления кластеров | и нахождения метрических сгущений. При кластеризации рассматриваются только ранги расстояний между подпоследовательностями. Для выявления кластеров |
Версия 20:23, 27 августа 2013
Катруца Александр Михайлович
МФТИ, ФУПМ, группа 074
Кафедра "Интеллектуальные системы"
Направление "Интеллектуальный анализ данных"
amkatrutsa@yandex.ru
Отчеты о научно-исследовательской работе
Весна 2013, 6-й семестр
Публикация
А. М. Катруца, М.П.Кузнецов, В.В. Стрижов, К.В. Рудаков Rho-net: быстрый алгоритм кластеризации с использованием матрицы парных расстояний в ранговых шкалах // JCAM
Предложен алгоритм ранговой кластеризации, основанный на построении <math>$\rho$</math>-сети и нахождения метрических сгущений. При кластеризации рассматриваются только ранги расстояний между подпоследовательностями. Для выявления кластеров используются парные расстояния между подпоследовательностями. Отличительной особенностью исследуемого алгоритма является то, что не требуется строить полную матрицу парных расстояний, что снижает его сложность. Алгоритм предназначен для решения задачи распознавания вторичной структуры белков и кластеризации подпоследовательности аминокислотных остатков. Работа алгоритма проиллюстрирована синтетическими данными и данными из базы UniProt. Предложен набор тестов и про- анализирована зависимость качества работы рангового алгоритма кластеризации от параметров. Проведено сравнение предложенного алгоритма с известными на различных выборках. Алгоритмы тестировались на модельных данных и реальных данных из репозитория UCI.