Участник:Arsenty
Материал из MachineLearning.
(→Осень 2012, 7-й семестр) |
(→Осень 2012, 7-й семестр) |
||
Строка 53: | Строка 53: | ||
*{{Статья | *{{Статья | ||
|автор = А. А. Кузьмин, В. В. Стрижов | |автор = А. А. Кузьмин, В. В. Стрижов | ||
- | |название = | + | |название = Проверка адекватности тематических моделейколлекции документов. |
|журнал = Программная инженерия. | |журнал = Программная инженерия. | ||
|год = 2013 | |год = 2013 | ||
- | |номер = | + | |номер = 4 |
- | |ISSN = | + | |ISSN = 2220-3397 |
|язык = russian | |язык = russian | ||
- | |страницы = | + | |страницы = 16-20 |
|url = http://novtex.ru/pi.html | |url = http://novtex.ru/pi.html | ||
}} | }} |
Версия 11:11, 8 июля 2013
МФТИ, ФУПМ
Кафедра "Интеллектуальные системы"
Направление "Интеллектуальный анализ данных"
Mailto: senatormipt@gmail.ru
Отчеты о научно-исследовательской работе
Весна 2012, 6-й семестр
Многоуровневая классификация при обнаружении движения цен.
В данной работе рассматривается один из возможных методов прогнозирования, основанный на модели логистической регрессии. Предлагается способ разметки пучка временных рядов и построения матрицы объект --- признак. Алгоритм проверяется на синтетических пучках временных рядов вида зашумленных синусов и периодических трапеций. Как вариант практического применения, алгоритм тестируется на данных о потреблении электроэнергии.
Публикация
- Кузьмин А.А. Многоуровневая классификация при обнаружении движения цен // Машинное обучение и анализ данных. — 2012. — № 3. — С. 318-327. — ISSN 2223-3792.
Осень 2012, 7-й семестр
Выбор признаков и оптимизация метрики при кластеризации коллекции документов.
Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предложен алгоритм выбора оптимальной функции расстояния между документами. Исследуется соответствие между полученной кластеризацией документов и их экспертной классификацией. Результаты кластеризации и их соответствие экспертной тематической классификации проиллюстрированы вычислительным экспериментом на реальной коллекции документов.'
Публикация
- А. А. Кузьмин, А. А. Адуенко, В. В. Стрижов Выбор признаков и оптимизация метрики при кластеризации коллекции документов // Известия ТулГУ.. — 2012. — № 3. — С. 119-131. — ISSN 2071-6141.
Проверка адекватности тематических моделей коллекции документов.
Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предлагается алгоритм построения иерархической модели. Определяется степень несоответствия экспертной модели и предлагаемой. В работе сравнивается качество моделей, полученных с помощью агломеративного и дивизимного алгоритов. Визуализируются отличия полученной модели от экспертной. Предлагаемый алгоритм построения тематической модели проиллюстрирован кластеризацией коллекции тезисов конференции EURO 2012.'
Публикация
- А. А. Кузьмин, В. В. Стрижов Проверка адекватности тематических моделейколлекции документов. // Программная инженерия.. — 2013. — № 4. — С. 16-20. — ISSN 2220-3397.