Участник:Katrutsa

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Весна 2013, 6-й семестр)
(Отчеты о научно-исследовательской работе)
Строка 28: Строка 28:
параметров. Проведено сравнение предложенного алгоритма с известными на различных выборках. Алгоритмы тестировались на модельных данных и реальных данных
параметров. Проведено сравнение предложенного алгоритма с известными на различных выборках. Алгоритмы тестировались на модельных данных и реальных данных
из репозитория UCI.
из репозитория UCI.
 +
 +
=== Осень 2013, 7-й семестр ===
 +
 +
Ранжирование поисковой выдачи.
 +
 +
Требуется по данному множеству запросов и документов отранжировать документы, соответствующие одному запросу по степени релевантности. Обучающая выборка состоит из признакового описания документов, идентификатора запроса и оценки ассесора. Предлгается использовать логистическую регрессию и отбор признаков для нахождения оценок релевантности.
 +
 +
Публикация
 +
 +
А. М. Катруца Ранжирование поисковой выдачи: технический отчет // Вычислительный сервер журнала "Машинное обучение и анализ данных" [Электронный ресурс] URL: mvr.jmlda.org (дата обращения: 26.12.2013).

Версия 08:16, 30 декабря 2013

Катруца Александр Михайлович

МФТИ, ФУПМ, группа 074

Кафедра "Интеллектуальные системы"

Направление "Интеллектуальный анализ данных"

amkatrutsa@yandex.ru


Отчеты о научно-исследовательской работе

Весна 2013, 6-й семестр

Публикация

А. М. Катруца, М.П.Кузнецов, В.В. Стрижов, К.В. Рудаков Rho-net: быстрый алгоритм кластеризации с использованием матрицы парных расстояний в ранговых шкалах // JCAM

Предложен алгоритм ранговой кластеризации, основанный на построении $\rho$-сети и нахождения метрических сгущений. При кластеризации рассматриваются только ранги расстояний между подпоследовательностями. Для выявления кластеров используются парные расстояния между подпоследовательностями. Отличительной особенностью исследуемого алгоритма является то, что не требуется строить полную матрицу парных расстояний, что снижает его сложность. Алгоритм предназначен для решения задачи распознавания вторичной структуры белков и кластеризации подпоследовательности аминокислотных остатков. Работа алгоритма проиллюстрирована синтетическими данными и данными из базы UniProt. Предложен набор тестов и про- анализирована зависимость качества работы рангового алгоритма кластеризации от параметров. Проведено сравнение предложенного алгоритма с известными на различных выборках. Алгоритмы тестировались на модельных данных и реальных данных из репозитория UCI.

Осень 2013, 7-й семестр

Ранжирование поисковой выдачи.

Требуется по данному множеству запросов и документов отранжировать документы, соответствующие одному запросу по степени релевантности. Обучающая выборка состоит из признакового описания документов, идентификатора запроса и оценки ассесора. Предлгается использовать логистическую регрессию и отбор признаков для нахождения оценок релевантности.

Публикация

А. М. Катруца Ранжирование поисковой выдачи: технический отчет // Вычислительный сервер журнала "Машинное обучение и анализ данных" [Электронный ресурс] URL: mvr.jmlda.org (дата обращения: 26.12.2013).

Личные инструменты