Участник:Celyh

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Отчеты о научно-исследовательской работе)
Строка 1: Строка 1:
__NOTOC__
__NOTOC__
 +
'''Целых Влада Руслановна'''
 +
'''МФТИ, ФУПМ'''
'''МФТИ, ФУПМ'''

Версия 15:19, 25 декабря 2013

Целых Влада Руслановна

МФТИ, ФУПМ

Кафедра "Интеллектуальные системы"

Направление "Интеллектуальный анализ данных"

Mailto: Celyh@inbox.ru

Отчеты о научно-исследовательской работе

Весна 2012, 6-й семестр

Многомерные адаптивные регрессионные сплайны

В работе рассматриваются многомерные адаптивные регрессионные сплайны. Метод позволяет получить модели, дающие достаточно точную аппроксимацию, даже в тех случаях, когда связи между предикторными и зависимыми переменными имеют немонотонный характер и сложны для приближения параметрическими моделями. Экспериментально исследуется зависимость ошибки аппроксимации от сложности модели. Для иллюстрации работы метода используются тестовые данные, данные ЭКГ и данные из области финансовой математики.

Публикация

Осень 2012, 7-й семестр

Критерии согласия для разреженных дискретных распределений и их применение в тематическом моделировании

Критерий согласия Пирсона неприменим к сильно разреженным распределениям, так как в этих случаях распределение статистики плохо описывается асимптотическим законом хи-квадрат, зависит от длины выборки и вида исходного распределения. В данной работе предлагаются статистические критерии, основанные на сэмплировании Монте-Карло, и рассматривается их применение в задачах анализа текстов, в частности, для проверки гипотезы условной независимости при построении и оценивании вероятностных тематических моделей.

Публикация

  • Целых В.Р., Воронцов К.В. Критерии согласия для разреженных дискретных распределений и их применение в тематическом моделировании // Машинное обучение и анализ данных. — 2012. — № 4. — С. 436-446.

Весна 2013, 8-й семестр

Статистические критерии адекватности вероятностных тематических моделей коллекции текстовых документов

Работа посвящена построению критерия, проверяющего одно из основных предположений тематического моделирования - гипотезу условной независимости слов в теме от документа. Предлагаются два статистических теста: один основан на вычислении эмпирических распределений статистики хи-квадрат путём сэмплирования, а второй - на множественном использовании точного теста Фишера. Рассматривается применение предложенных тестов для проверки адекватности вероятностных тематических моделей.

Осень 2013, 9-й семестр

Лингвистические методы анализа электрокардиограмм

В работе исследована возможность диагностики заболеваний внутренних органов по данным об амплитудах и интервалах кардиоциклов. Реализован метод информационного анализа ЭКГ-сигналов, основанный на представлении ЭКГ в виде последовательности символов (кодограммы) и заключающийся в определении диагностических эталонов заболеваний. Разработаны различные алгоритмы классификации, проведен их анализ и сравнение.

Личные инструменты