Участник:Aduenko
Материал из MachineLearning.
м (→Осень 2012, 7-й семестр) |
м (→Осень 2012, 7-й семестр) |
||
Строка 35: | Строка 35: | ||
=== Осень 2012, 7-й семестр=== | === Осень 2012, 7-й семестр=== | ||
'''Выбор признаков и оптимизация метрики при кластеризации коллекции документов''' | '''Выбор признаков и оптимизация метрики при кластеризации коллекции документов''' | ||
- | Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предложен алгоритм выбора оптимальной функции расстояния между документами. Исследуется соответствие между полученной кластеризацией документов и их экспертной классификацией. Результаты кластеризации и их соответствие экспертной тематической классификации проиллюстрированы вычислительным экспериментом на реальной коллекции документов. | + | |
+ | ''Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предложен алгоритм выбора оптимальной функции расстояния между документами. Исследуется соответствие между полученной кластеризацией документов и их экспертной классификацией. Результаты кластеризации и их соответствие экспертной тематической классификации проиллюстрированы вычислительным экспериментом на реальной коллекции документов.''' | ||
'''Публикация''' | '''Публикация''' | ||
+ | *{{Статья | ||
+ | |автор = А. А. Адуенко, А. А. Кузьмин, В. В. Стрижов | ||
+ | |название = Выбор признаков и оптимизация метрики при кластеризации коллекции документов | ||
+ | |журнал = Известия ТулГУ. | ||
+ | |год = 2012 | ||
+ | |номер = 3 | ||
+ | |ISSN = 2071-6141 | ||
+ | |язык = russian | ||
+ | |страницы = 119-131 | ||
+ | |url = http://publishing.tsu.tula.ru/EstestvNauki.html | ||
+ | }} | ||
- | + | '''Визуализация матрицы парных расстояний между документами''' | |
+ | |||
+ | ''В работе рассматривается алгоритм визуализации результатов тематической кластеризации коллекции документов. С помощью метода главных компонент матрица парных расстояний между документами оптимальным способом проецируется на плоскость. Предложена такая функция потерь, которая позволяет расположить название тем на плоскости с минимальным перекрытием. Алгоритм проиллюстрирован примером визуализации тезисов конференции.''' | ||
+ | |||
+ | '''Публикация''' | ||
+ | *{{Статья | ||
+ | |автор = А. А. Адуенко, В. В. Стрижов | ||
+ | |название = Визуализация матрицы парных расстояний между документами | ||
+ | |журнал = Научно-технические ведомости С.-Пб.ПГУ | ||
+ | |год = 2013 | ||
+ | |номер = 1 | ||
+ | |ISSN = | ||
+ | |язык = russian | ||
+ | |страницы = | ||
+ | |url = http://ntv.spbstu.ru/index4.html | ||
+ | }} | ||
+ | |||
+ | '''Алгоритм оптимального расположения названий коллекции документов''' | ||
+ | |||
+ | ''В работе исследуется метод визуализации результатов тематической кластеризации коллекции документов. Матрица парных расстояний между документами оптимальным способом спроецирована на плоскость. Требуется расположить названия документов оптимальным образом. Предложена такая функция потерь, которая позволяет расположить название тем на плоскости с минимальным перекрытием. Для ее минимизации использовался алгоритм BFGS. Алгоритм проиллюстрирован примером визуализации тезисов конференции.''' | ||
+ | |||
+ | '''Публикация''' | ||
+ | *{{Статья | ||
+ | |автор = А. А. Адуенко, В. В. Стрижов | ||
+ | |название = Алгоритм оптимального расположения названий коллекции документов | ||
+ | |журнал = Программная инженерия | ||
+ | |год = 2013 | ||
+ | |номер = 1 | ||
+ | |ISSN = | ||
+ | |язык = russian | ||
+ | |страницы = | ||
+ | |url = http://novtex.ru/pi.html | ||
+ | }} |
Версия 08:51, 26 декабря 2012
МФТИ, ФУПМ
Кафедра "Интеллектуальные системы"
Направление "Интеллектуальный анализ данных"
Mailto: aduenko1@gmail.com
Отчеты о научно-исследовательской работе
Весна 2012, 6-й семестр
Выбор признаков и шаговая логистическая регрессия для задачи кредитного скоринга
Работа посвящена выбору оптимального набора признаков для определения уровня надеж- ности заемщиков, подавших заявку на банковский кредит. Для ответа на поставленный вопрос оценивается вероятность невозврата кредита. Для отбора признаков используется шаговая регрессия, исследуется зависимость информативности отобранных признаков от параметров шаговой регрессии. В вычислительном эксперименте алгоритм тестируется на данных потребителей, подававших заявки на кредиты в определенный банк, а также на данных об отклике клиентов на маркетинговую кампанию банка.
Публикация
- Адуенко А.А. Выбор признаков и шаговая логистическая регрессия для задачи кредитного скоринга // Машинное обучение и анализ данных. — 2012. — № 3. — С. 279-291. — ISSN 2223-3792.
Осень 2012, 7-й семестр
Выбор признаков и оптимизация метрики при кластеризации коллекции документов
Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предложен алгоритм выбора оптимальной функции расстояния между документами. Исследуется соответствие между полученной кластеризацией документов и их экспертной классификацией. Результаты кластеризации и их соответствие экспертной тематической классификации проиллюстрированы вычислительным экспериментом на реальной коллекции документов.'
Публикация
- А. А. Адуенко, А. А. Кузьмин, В. В. Стрижов Выбор признаков и оптимизация метрики при кластеризации коллекции документов // Известия ТулГУ.. — 2012. — № 3. — С. 119-131. — ISSN 2071-6141.
Визуализация матрицы парных расстояний между документами
В работе рассматривается алгоритм визуализации результатов тематической кластеризации коллекции документов. С помощью метода главных компонент матрица парных расстояний между документами оптимальным способом проецируется на плоскость. Предложена такая функция потерь, которая позволяет расположить название тем на плоскости с минимальным перекрытием. Алгоритм проиллюстрирован примером визуализации тезисов конференции.'
Публикация
- А. А. Адуенко, В. В. Стрижов Визуализация матрицы парных расстояний между документами // Научно-технические ведомости С.-Пб.ПГУ. — 2013. — № 1.
Алгоритм оптимального расположения названий коллекции документов
В работе исследуется метод визуализации результатов тематической кластеризации коллекции документов. Матрица парных расстояний между документами оптимальным способом спроецирована на плоскость. Требуется расположить названия документов оптимальным образом. Предложена такая функция потерь, которая позволяет расположить название тем на плоскости с минимальным перекрытием. Для ее минимизации использовался алгоритм BFGS. Алгоритм проиллюстрирован примером визуализации тезисов конференции.'
Публикация
- А. А. Адуенко, В. В. Стрижов Алгоритм оптимального расположения названий коллекции документов // Программная инженерия. — 2013. — № 1.
Категории: Адуенко А.А. (публикации) | 2012 (публикации) | Машинное обучение и анализ данных (статьи) | А. А. Адуенко, А. А. Кузьмин, В. В. Стрижов (публикации) | Известия ТулГУ. (статьи) | А. А. Адуенко, В. В. Стрижов (публикации) | 2013 (публикации) | Научно-технические ведомости С.-Пб.ПГУ (статьи) | Программная инженерия (статьи)