Статистический кластерный анализ (регулярный семинар)
Материал из MachineLearning.
(→Кластеризация на графах) |
(→Метрическая кластеризация) |
||
Строка 86: | Строка 86: | ||
1. Задача одномерной оценки плотности | 1. Задача одномерной оценки плотности | ||
- | [https://www.dropbox.com/s/4nwzi91ubo1nrdy/Introduction%20to%20Nonparametric%20Estimation.pdf?dl=0] Alexandre B. Tsybakov | + | [https://www.dropbox.com/s/4nwzi91ubo1nrdy/Introduction%20to%20Nonparametric%20Estimation.pdf?dl=0] Alexandre B. Tsybakov "Introduction to Nonparametric Estimation" |
[https://projecteuclid.org/euclid.aos/1176348901] Luc Devroye, "A note on the usefulness of superkernels in density estimation" | [https://projecteuclid.org/euclid.aos/1176348901] Luc Devroye, "A note on the usefulness of superkernels in density estimation" | ||
Строка 92: | Строка 92: | ||
2. Задача одномерной кластеризации | 2. Задача одномерной кластеризации | ||
- | [http://www.researchgate.net/publication/251400257_One-dimensional_center-based_l_1_-clustering_method] Kristian Sabo, Rudolf Scitovski, Ivan Vazler | + | [http://www.researchgate.net/publication/251400257_One-dimensional_center-based_l_1_-clustering_method] Kristian Sabo, Rudolf Scitovski, Ivan Vazler "One-dimensional center-based l_1-clustering method" |
- | l_1-clustering method" | + | |
- | [http://cs229.stanford.edu/notes/cs229-notes8.pdf] Andrew Ng | + | [http://cs229.stanford.edu/notes/cs229-notes8.pdf] Andrew Ng "The EM algorithm" |
3. Задача многомерной кластеризации и оценки плотности | 3. Задача многомерной кластеризации и оценки плотности | ||
- | [http://projecteuclid.org/euclid.aos/1278861457] Alessandro Rinaldo and Larry Wasserman | + | [http://projecteuclid.org/euclid.aos/1278861457] Alessandro Rinaldo and Larry Wasserman "Generalized Density Clustering |
- | [http://arxiv.org/abs/1409.8437] Ingo Steinwart | + | [http://arxiv.org/abs/1409.8437] Ingo Steinwart "Fully adaptive density-based clustering" |
- | [https://www.dropbox.com/s/4nwzi91ubo1nrdy/Introduction%20to%20Nonparametric%20Estimation.pdf?dl=0] Alexandre B. Tsybakov | + | [https://www.dropbox.com/s/4nwzi91ubo1nrdy/Introduction%20to%20Nonparametric%20Estimation.pdf?dl=0] Alexandre B. Tsybakov "Introduction to Nonparametric Estimation" |
4. Стабильность кластеризации | 4. Стабильность кластеризации | ||
- | [http://arxiv.org/abs/1007.1075] Ulrike von Luxburg | + | [http://arxiv.org/abs/1007.1075] Ulrike von Luxburg "Clustering Stability: An Overview" |
Версия 07:33, 3 декабря 2015
Содержание |
Описание семинара
Задача кластеризации известна всем, кто имел дело с машинным обучением, и имеет бесчисленное множество практических применений. Кроме того, известно, что задача кластеризации может быть сформулирована разными способами, то есть не имеет чёткой общепринятой постановки. В рамках данного семинара изучаются статистические подходы к задаче кластеризации. Отдельное внимание в работе уделяется кластеризации графов. Целью работы группы является построение алгоритмов кластеризации и кластеризации графов, которые обладают практической эффективностью, и при это допускают теоретический анализ.
Время заседаний
Регулярный семинар, проводится в ИППИ РАН по средам в 18-30, ауд. 615.
Научные руководители семинара
М.Е. Панов, С. Довгаль, В. Г. Спокойный
Организатор семинара
Совместный учебно-научный семинар магистерской программы Математические методы оптимизации и стохастики Факультета Компьютерных наук НИУ ВШЭ, Института проблем передачи информации РАН и Лаборатории ПреМоЛаб МФТИ. Куратор семинара М.Е. Панов
Заседания
13 октября 2015 г.
Игорь Силин "Минимаксное оценивание в Stochastic Block Models"
28 октября 2015 г.
1. Игорь Силин — продолжение рассказа
2. Обсуждение тем курсовых работы для студентов программы ММОС.
11 ноября 2015 г.
Константин Славнов "Методы выделения сообществ в применении к анализу социальных сетей"
Обзорный доклад, который посвящен теме социальных графов и обзору способов выделения сообществ на основе функционала модулярности. Будут рассмотрены некоторые свойства модулярности, 7 алгоритмов выделения структуры сообществ (Betweenness, Fastgreedy, Multilevel, LabelPropogation, Walktrap, Infomap, Eigenvector), а также рассказаны собственные результаты по способам композиции различных методов выделения сообществ.
Презентация, Текст работы «Анализ социальных графов»
18 ноября 2015 г.
Сергей Довгаль "Кластеризация с адаптивными весами"
На докладе мы расскажем об алгоритме AWC (Adaptive Weights Clustering). Мы посмотрим, какие геометрические подзадачи возникают при задаче кластеризации и опишем основные свойства этого алгоритма. Алгоритм исследуется для метрической кластеризации, но его можно применять для произвольных графов, на которых задана матрица расстояний.
2 декабря 2015 г.
Максим Панов "Введение в спектральные методы кластеризации"
В рамках доклада мы расскажем об алгоритме спектральной кластеризации (Spectral clustering). Данный алгоритм прост в реализации и часто превосходит другие традиционные алгоритмы кластеризации. Цель доклада состоит в том, чтобы дать аудитории интуитивное понимание математических идей, лежащих в основе алгоритма. Будут рассмотрены различные виды лапласианов графа и их основные свойства, а также представлены наиболее популярные варианты алгоритма спектральной кластеризации.
Литература
Кластеризация на графах
1. Stochastic block models and graphon estimation
[1] Chao Gao, Yu Lu, Harrison H. Zhou "Rate-optimal Graphon Estimation"
[2] Olga Klopp, Alexandre B. Tsybakov, Nicolas Verzelen "Oracle inequalities for network models and sparse graphon estimation"
2. Кластеризация графов на основе модулярности
[3] Santo Fortunato "Community detection in graphs"
[4] Twan van Laarhoven, Elena Marchiori "Axioms for graph clustering quality functions"
[5] Yunpeng Zhao, Elizaveta Levina, Ji Zhu "Consistency of community detection in networks under degree-corrected stochastic block models"
3. Графы ближайших соседей и их кластеризация
[6] Ulrike von Luxburg, Morteza Alamgir "Density estimation from unweighted k-nearest neighbor graphs: a roadmap"
[7] Matthaus Kleindessner, Ulrike von "Luxburg Dimensionality estimation without distances"
4. Обнаружение пересекающихся сообществ в больших сетях: алгоритм BigCLAM и его обобщения
[8] Jaewon Yang, Jure Leskovec "Overlapping Community Detection at Scale: A Nonnegative Matrix Factorization Approach"
5. Spectral clustering
[9] Ulrike von Luxburg "A Tutorial on Spectral Clustering"
[10] Donghui Yan, Ling Huang, Michael I. Jordan "Fast Approximate Spectral Clustering"
Метрическая кластеризация
1. Задача одномерной оценки плотности
[11] Alexandre B. Tsybakov "Introduction to Nonparametric Estimation"
[12] Luc Devroye, "A note on the usefulness of superkernels in density estimation"
2. Задача одномерной кластеризации
[13] Kristian Sabo, Rudolf Scitovski, Ivan Vazler "One-dimensional center-based l_1-clustering method"
[14] Andrew Ng "The EM algorithm"
3. Задача многомерной кластеризации и оценки плотности
[15] Alessandro Rinaldo and Larry Wasserman "Generalized Density Clustering
[16] Ingo Steinwart "Fully adaptive density-based clustering"
[17] Alexandre B. Tsybakov "Introduction to Nonparametric Estimation"
4. Стабильность кластеризации
[18] Ulrike von Luxburg "Clustering Stability: An Overview"