Участник:Aduenko

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (Осень 2012, 7-й семестр)
м (Осень 2012, 7-й семестр)
Строка 35: Строка 35:
=== Осень 2012, 7-й семестр===
=== Осень 2012, 7-й семестр===
'''Выбор признаков и оптимизация метрики при кластеризации коллекции документов'''
'''Выбор признаков и оптимизация метрики при кластеризации коллекции документов'''
-
Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предложен алгоритм выбора оптимальной функции расстояния между документами. Исследуется соответствие между полученной кластеризацией документов и их экспертной классификацией. Результаты кластеризации и их соответствие экспертной тематической классификации проиллюстрированы вычислительным экспериментом на реальной коллекции документов.
+
 
 +
''Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предложен алгоритм выбора оптимальной функции расстояния между документами. Исследуется соответствие между полученной кластеризацией документов и их экспертной классификацией. Результаты кластеризации и их соответствие экспертной тематической классификации проиллюстрированы вычислительным экспериментом на реальной коллекции документов.'''
'''Публикация'''
'''Публикация'''
 +
*{{Статья
 +
|автор = А. А. Адуенко, А. А. Кузьмин, В. В. Стрижов
 +
|название = Выбор признаков и оптимизация метрики при кластеризации коллекции документов
 +
|журнал = Известия ТулГУ.
 +
|год = 2012
 +
|номер = 3
 +
|ISSN = 2071-6141
 +
|язык = russian
 +
|страницы = 119-131
 +
|url = http://publishing.tsu.tula.ru/EstestvNauki.html
 +
}}
-
А. А. Адуенко, А. А. Кузьмин, В. В. Стрижов Выбор признаков и оптимизация метрики при кластеризации коллекции документов // Известия ТулГУ. — 2012. — № 3. — С. 119-131. ISSN 2071-6141.
+
'''Визуализация матрицы парных расстояний между документами'''
 +
 
 +
''В работе рассматривается алгоритм визуализации результатов тематической кластеризации коллекции документов. С помощью метода главных компонент матрица парных расстояний между документами оптимальным способом проецируется на плоскость. Предложена такая функция потерь, которая позволяет расположить название тем на плоскости с минимальным перекрытием. Алгоритм проиллюстрирован примером визуализации тезисов конференции.'''
 +
 
 +
'''Публикация'''
 +
*{{Статья
 +
|автор = А. А. Адуенко, В. В. Стрижов
 +
|название = Визуализация матрицы парных расстояний между документами
 +
|журнал = Научно-технические ведомости С.-Пб.ПГУ
 +
|год = 2013
 +
|номер = 1
 +
|ISSN =
 +
|язык = russian
 +
|страницы =
 +
|url = http://ntv.spbstu.ru/index4.html
 +
}}
 +
 
 +
'''Алгоритм оптимального расположения названий коллекции документов'''
 +
 
 +
''В работе исследуется метод визуализации результатов тематической кластеризации коллекции документов. Матрица парных расстояний между документами оптимальным способом спроецирована на плоскость. Требуется расположить названия документов оптимальным образом. Предложена такая функция потерь, которая позволяет расположить название тем на плоскости с минимальным перекрытием. Для ее минимизации использовался алгоритм BFGS. Алгоритм проиллюстрирован примером визуализации тезисов конференции.'''
 +
 
 +
'''Публикация'''
 +
*{{Статья
 +
|автор = А. А. Адуенко, В. В. Стрижов
 +
|название = Алгоритм оптимального расположения названий коллекции документов
 +
|журнал = Программная инженерия
 +
|год = 2013
 +
|номер = 1
 +
|ISSN =
 +
|язык = russian
 +
|страницы =
 +
|url = http://novtex.ru/pi.html
 +
}}

Версия 08:51, 26 декабря 2012

МФТИ, ФУПМ

Кафедра "Интеллектуальные системы"

Направление "Интеллектуальный анализ данных"

Mailto: aduenko1@gmail.com

Отчеты о научно-исследовательской работе

Весна 2012, 6-й семестр

Выбор признаков и шаговая логистическая регрессия для задачи кредитного скоринга

Работа посвящена выбору оптимального набора признаков для определения уровня надеж- ности заемщиков, подавших заявку на банковский кредит. Для ответа на поставленный вопрос оценивается вероятность невозврата кредита. Для отбора признаков используется шаговая регрессия, исследуется зависимость информативности отобранных признаков от параметров шаговой регрессии. В вычислительном эксперименте алгоритм тестируется на данных потребителей, подававших заявки на кредиты в определенный банк, а также на данных об отклике клиентов на маркетинговую кампанию банка.

Публикация

Осень 2012, 7-й семестр

Выбор признаков и оптимизация метрики при кластеризации коллекции документов

Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предложен алгоритм выбора оптимальной функции расстояния между документами. Исследуется соответствие между полученной кластеризацией документов и их экспертной классификацией. Результаты кластеризации и их соответствие экспертной тематической классификации проиллюстрированы вычислительным экспериментом на реальной коллекции документов.'

Публикация

  • А. А. Адуенко, А. А. Кузьмин, В. В. Стрижов Выбор признаков и оптимизация метрики при кластеризации коллекции документов // Известия ТулГУ.. — 2012. — № 3. — С. 119-131. — ISSN 2071-6141.

Визуализация матрицы парных расстояний между документами

В работе рассматривается алгоритм визуализации результатов тематической кластеризации коллекции документов. С помощью метода главных компонент матрица парных расстояний между документами оптимальным способом проецируется на плоскость. Предложена такая функция потерь, которая позволяет расположить название тем на плоскости с минимальным перекрытием. Алгоритм проиллюстрирован примером визуализации тезисов конференции.'

Публикация

Алгоритм оптимального расположения названий коллекции документов

В работе исследуется метод визуализации результатов тематической кластеризации коллекции документов. Матрица парных расстояний между документами оптимальным способом спроецирована на плоскость. Требуется расположить названия документов оптимальным образом. Предложена такая функция потерь, которая позволяет расположить название тем на плоскости с минимальным перекрытием. Для ее минимизации использовался алгоритм BFGS. Алгоритм проиллюстрирован примером визуализации тезисов конференции.'

Публикация

  • А. А. Адуенко, В. В. Стрижов Алгоритм оптимального расположения названий коллекции документов // Программная инженерия. — 2013. — № 1.
Личные инструменты