Статистический кластерный анализ (регулярный семинар)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Литература)
(Литература)
Строка 32: Строка 32:
== Литература ==
== Литература ==
 +
 +
=== Кластеризация на графах ===
1. Stochastic block models and graphon estimation
1. Stochastic block models and graphon estimation
Строка 64: Строка 66:
[http://www.cs.berkeley.edu/~jordan/papers/yan-etal-long.pdf] Donghui Yan, Ling Huang, Michael I. Jordan "Fast Approximate Spectral Clustering
[http://www.cs.berkeley.edu/~jordan/papers/yan-etal-long.pdf] Donghui Yan, Ling Huang, Michael I. Jordan "Fast Approximate Spectral Clustering
"
"
 +
 +
=== Метрическая кластеризация ===
 +
 +
1. Задача одномерной оценки плотности
 +
 +
[http://bookfi.org/book/510172] --- Tsybakov, Nonparametric Estimation
 +
 +
[https://projecteuclid.org/euclid.aos/1176348901] --- Superkernels in density estimation
 +
 +
2. Задача одномерной кластеризации
 +
 +
[http://www.researchgate.net/publication/251400257_One-dimensional_center-based_l_1_-clustering_method] --- One-dimensional center-based l 1 -clustering
 +
method
 +
 +
[cs229.stanford.edu/notes/cs229-notes8.pdf] --- EM-algorithm
 +
 +
3. Задача многомерной кластеризации и оценки плотности
 +
 +
[http://projecteuclid.org/euclid.aos/1278861457] --- Generalized Density Clustering
 +
 +
[http://bookfi.org/book/510172] --- Tsybakov, Nonparametric Estimation
 +
 +
4. Стабильность кластеризации
 +
 +
[http://arxiv.org/abs/1007.1075] --- Ulrike von Luxburg, Clustering Stability

Версия 15:26, 3 ноября 2015

Содержание

Описание семинара

Задача кластеризации известна всем, кто имел дело с машинным обучением, и имеет бесчисленное множество практических применений. Кроме того, известно, что задача кластеризации может быть сформулирована разными способами, то есть не имеет чёткой общепринятой постановки. В рамках данного семинара изучаются статистические подходы к задаче кластеризации. Отдельное внимание в работе уделяется кластеризации графов. Целью работы группы является построение алгоритмов кластеризации и кластеризации графов, которые обладают практической эффективностью, и при это допускают теоретический анализ.

Время заседаний

Регулярный семинар, проводится в ИППИ РАН по средам в 18-30, ауд. 615.

Научные руководители семинара

М.Е. Панов, С. Довгаль, В. Г. Спокойный

Организатор семинара

Совместный учебно-научный семинар магистерской программы Математические методы оптимизации и стохастики Факультета Компьютерных наук НИУ ВШЭ, Института проблем передачи информации РАН и Лаборатории ПреМоЛаб МФТИ. Куратор семинара М.Е. Панов

Заседания

13 октября 2015 г.

Игорь Силин "Минимаксное оценивание в Stochastic Block Models"

28 октября 2015 г.

1. Игорь Силин — продолжение рассказа

2. Обсуждение тем курсовых работы для студентов программы ММОС.


11 ноября 2015 г.

Константин Славнов TBA

Литература

Кластеризация на графах

1. Stochastic block models and graphon estimation

[1] Chao Gao, Yu Lu, Harrison H. Zhou "Rate-optimal Graphon Estimation"

[2] Olga Klopp, Alexandre B. Tsybakov, Nicolas Verzelen "Oracle inequalities for network models and sparse graphon estimation"

2. Кластеризация графов на основе модулярности

[3] Santo Fortunato "Community detection in graphs"

[4] Twan van Laarhoven, Elena Marchiori "Axioms for graph clustering quality functions"

[5] Yunpeng Zhao, Elizaveta Levina, Ji Zhu "Consistency of community detection in networks under degree-corrected stochastic block models"

3. Графы ближайших соседей и их кластеризация

[6] Ulrike von Luxburg, Morteza Alamgir "Density estimation from unweighted k-nearest neighbor graphs: a roadmap"

[7] Matthaus Kleindessner, Ulrike von "Luxburg Dimensionality estimation without distances"

4. Обнаружение пересекающихся сообществ в больших сетях: алгоритм BigCLAM и его обобщения

[8] Jaewon Yang, Jure Leskovec "Overlapping Community Detection at Scale: A Nonnegative Matrix Factorization Approach"

5. Spectral clustering

[9] Ulrike von Luxburg "A Tutorial on Spectral Clustering"

[10] Donghui Yan, Ling Huang, Michael I. Jordan "Fast Approximate Spectral Clustering "

Метрическая кластеризация

1. Задача одномерной оценки плотности

[11] --- Tsybakov, Nonparametric Estimation

[12] --- Superkernels in density estimation

2. Задача одномерной кластеризации

[13] --- One-dimensional center-based l 1 -clustering method

[cs229.stanford.edu/notes/cs229-notes8.pdf] --- EM-algorithm

3. Задача многомерной кластеризации и оценки плотности

[14] --- Generalized Density Clustering

[15] --- Tsybakov, Nonparametric Estimation

4. Стабильность кластеризации

[16] --- Ulrike von Luxburg, Clustering Stability

Личные инструменты