Участник:Celyh

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Весна 2012, 6-й семестр)
(Весна 2012, 6-й семестр)
Строка 27: Строка 27:
|url = http://mlalgorithms.svn.sourceforge.net/viewvc/mlalgorithms/JMLDA/2012no3/pdf/Celyh2012MARS.pdf?revision=2727
|url = http://mlalgorithms.svn.sourceforge.net/viewvc/mlalgorithms/JMLDA/2012no3/pdf/Celyh2012MARS.pdf?revision=2727
}}
}}
 +
=== Осень 2012, 7-й семестр===
 +
'''Критерии согласия для разреженных дискретных распределений и их применение в тематическом моделировании'''
 +
 +
'' Критерий согласия Пирсона неприменим к сильно разреженным распределениям, так как в этих случаях распределение статистики плохо описывается асимптотическим законом хи-квадрат, зависит от длины выборки и вида исходного распределения. В данной работе предлагаются статистические критерии, основанные на сэмплировании Монте-Карло, и рассматривается их применение в задачах анализа текстов, в частности, для проверки гипотезы условной независимости при построении и оценивании вероятностных тематических моделей.''

Версия 10:51, 26 декабря 2012

МФТИ, ФУПМ

Кафедра "Интеллектуальные системы"

Направление "Интеллектуальный анализ данных"

Mailto: Celyh@inbox.ru

Отчеты о научно-исследовательской работе

Весна 2012, 6-й семестр

Многомерные адаптивные регрессионные сплайны

В работе рассматриваются многомерные адаптивные регрессионные сплайны. Метод позволяет получить модели, дающие достаточно точную аппроксимацию, даже в тех случаях, когда связи между предикторными и зависимыми переменными имеют немонотонный характер и сложны для приближения параметрическими моделями. Экспериментально исследуется зависимость ошибки аппроксимации от сложности модели. Для иллюстрации работы метода используются тестовые данные, данные ЭКГ и данные из области финансовой математики.

Публикация

Осень 2012, 7-й семестр

Критерии согласия для разреженных дискретных распределений и их применение в тематическом моделировании

Критерий согласия Пирсона неприменим к сильно разреженным распределениям, так как в этих случаях распределение статистики плохо описывается асимптотическим законом хи-квадрат, зависит от длины выборки и вида исходного распределения. В данной работе предлагаются статистические критерии, основанные на сэмплировании Монте-Карло, и рассматривается их применение в задачах анализа текстов, в частности, для проверки гипотезы условной независимости при построении и оценивании вероятностных тематических моделей.

Личные инструменты