Участник:Aduenko

Материал из MachineLearning.

Перейти к: навигация, поиск

МФТИ, ФУПМ

Кафедра "Интеллектуальные системы"

Направление "Интеллектуальный анализ данных"

Mailto: aduenko1@gmail.com

Отчеты о научно-исследовательской работе

Весна 2012, 6-й семестр

Выбор признаков и шаговая логистическая регрессия для задачи кредитного скоринга

Работа посвящена выбору оптимального набора признаков для определения уровня надеж- ности заемщиков, подавших заявку на банковский кредит. Для ответа на поставленный вопрос оценивается вероятность невозврата кредита. Для отбора признаков используется шаговая регрессия, исследуется зависимость информативности отобранных признаков от параметров шаговой регрессии. В вычислительном эксперименте алгоритм тестируется на данных потребителей, подававших заявки на кредиты в определенный банк, а также на данных об отклике клиентов на маркетинговую кампанию банка.

Публикация

Осень 2012, 7-й семестр

Выбор признаков и оптимизация метрики при кластеризации коллекции документов

Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предложен алгоритм выбора оптимальной функции расстояния между документами. Исследуется соответствие между полученной кластеризацией документов и их экспертной классификацией. Результаты кластеризации и их соответствие экспертной тематической классификации проиллюстрированы вычислительным экспериментом на реальной коллекции документов.'

Публикация

  • А. А. Адуенко, А. А. Кузьмин, В. В. Стрижов Выбор признаков и оптимизация метрики при кластеризации коллекции документов // Известия ТулГУ.. — 2012. — № 3. — С. 119-131. — ISSN 2071-6141.

Визуализация матрицы парных расстояний между документами

В работе рассматривается алгоритм визуализации результатов тематической кластеризации коллекции документов. С помощью метода главных компонент матрица парных расстояний между документами оптимальным способом проецируется на плоскость. Предложена такая функция потерь, которая позволяет расположить название тем на плоскости с минимальным перекрытием. Алгоритм проиллюстрирован примером визуализации тезисов конференции.'

Публикация

Алгоритм оптимального расположения названий коллекции документов

В работе исследуется метод визуализации результатов тематической кластеризации коллекции документов. Матрица парных расстояний между документами оптимальным способом спроецирована на плоскость. Требуется расположить названия документов оптимальным образом. Предложена такая функция потерь, которая позволяет расположить название тем на плоскости с минимальным перекрытием. Для ее минимизации использовался алгоритм BFGS. Алгоритм проиллюстрирован примером визуализации тезисов конференции.'

Публикация

  • А. А. Адуенко, В. В. Стрижов Алгоритм оптимального расположения названий коллекции документов // Программная инженерия. — 2013. — № 1.
Личные инструменты