Алгебра над алгоритмами и эвристический поиск закономерностей
Материал из MachineLearning.
(→Заседания 2015—2016 уч. года) |
(→Заседания 2015—2016 уч. года) |
||
Строка 38: | Строка 38: | ||
| rowspan=2| 23 сентября 2015 | | rowspan=2| 23 сентября 2015 | ||
| ''Остапец Андрей'', аспирант | | ''Остапец Андрей'', аспирант | ||
- | | ''' | + | | Решение конкурса '''Avito Context Ad Clicks''' |
| [[Медиа:Ostapets_avito.pdf|слайды (pdf)]], [https://www.kaggle.com/c/avito-context-ad-clicks страница конкурса] | | [[Медиа:Ostapets_avito.pdf|слайды (pdf)]], [https://www.kaggle.com/c/avito-context-ad-clicks страница конкурса] | ||
|- | |- | ||
Строка 56: | Строка 56: | ||
| rowspan=2|7 октября 2015 | | rowspan=2|7 октября 2015 | ||
| ''Вихрева Мария'', 4-й курс | | ''Вихрева Мария'', 4-й курс | ||
- | | Доклад по статье "Geographical effects on epidemic spreading in scale-free networks" | + | | Доклад по статье '''"Geographical effects on epidemic spreading in scale-free networks"''' |
|[http://www.machinelearning.ru/wiki/images/7/76/Epidemic_spreading_in_SF_networks.pdf слайды (pdf)], [http://arxiv.org/pdf/physics/0606256v1.pdf статья (arxiv)] | |[http://www.machinelearning.ru/wiki/images/7/76/Epidemic_spreading_in_SF_networks.pdf слайды (pdf)], [http://arxiv.org/pdf/physics/0606256v1.pdf статья (arxiv)] | ||
|- | |- | ||
Строка 65: | Строка 65: | ||
| rowspan=2|14 октября 2015 | | rowspan=2|14 октября 2015 | ||
| ''Каюмов Эмиль'', 3-й курс | | ''Каюмов Эмиль'', 3-й курс | ||
- | | Доклад о работах Jure Leskovec из Стэнфордского университета | + | | Доклад о работах '''Jure Leskovec''' из Стэнфордского университета |
| [http://www.machinelearning.ru/wiki/images/3/38/About_articles_of_jure_leskovec_14.10.2015.pdf слайды (pdf)], [http://cs.stanford.edu/people/jure/pubs/powergrowth-kdd05.pdf статья 1], [http://cs.stanford.edu/people/jure/pubs/trolls-icwsm15.pdf статья 2] | | [http://www.machinelearning.ru/wiki/images/3/38/About_articles_of_jure_leskovec_14.10.2015.pdf слайды (pdf)], [http://cs.stanford.edu/people/jure/pubs/powergrowth-kdd05.pdf статья 1], [http://cs.stanford.edu/people/jure/pubs/trolls-icwsm15.pdf статья 2] | ||
|- | |- | ||
| ''Никишин Евгений'', 3-й курс | | ''Никишин Евгений'', 3-й курс | ||
- | | Доклад о работах Pedro Domingos из Вашингтонского университета | + | | Доклад о работах '''Pedro Domingos''' из Вашингтонского университета |
| [http://www.machinelearning.ru/wiki/images/c/c2/Nikishin_-_Report_on_Domingos.pdf слайды (pdf)], [http://web.cs.wpi.edu/~cs525/f13b-EAR/cs525-homepage/lectures/PAPERS/p71-domingos.pdf статья 1], [http://arxiv.org/pdf/1202.3732.pdf статья 2] | | [http://www.machinelearning.ru/wiki/images/c/c2/Nikishin_-_Report_on_Domingos.pdf слайды (pdf)], [http://web.cs.wpi.edu/~cs525/f13b-EAR/cs525-homepage/lectures/PAPERS/p71-domingos.pdf статья 1], [http://arxiv.org/pdf/1202.3732.pdf статья 2] | ||
|- | |- | ||
Строка 78: | Строка 78: | ||
|- | |- | ||
| ''Гущин Александр'', МФТИ | | ''Гущин Александр'', МФТИ | ||
- | | Решение конкурса Flavours of physics | + | | Решение конкурса '''Flavours of physics''' |
| | | | ||
|- | |- | ||
| rowspan=2|28 октября 2015 | | rowspan=2|28 октября 2015 | ||
| ''Остапец Андрей'', аспирант | | ''Остапец Андрей'', аспирант | ||
- | | Доклад о диссертации Aris Kosmopoulos, посвященной иерархической классификации текстов | + | | Доклад о диссертации '''Aris Kosmopoulos''', посвященной иерархической классификации текстов |
| [[Медиа:Presentation phd lshtc.pdf|слайды (pdf)]], [http://nlp.cs.aueb.gr/theses/akosmopoulos_phd_thesis.pdf диссертация] | | [[Медиа:Presentation phd lshtc.pdf|слайды (pdf)]], [http://nlp.cs.aueb.gr/theses/akosmopoulos_phd_thesis.pdf диссертация] | ||
|- | |- | ||
| ''Нижибицкий Евгений'', аспирант | | ''Нижибицкий Евгений'', аспирант | ||
- | | DeepHear — Composing and harmonizing music with neural networks | + | | '''DeepHear — Composing and harmonizing music with neural networks''' |
| | | | ||
|- | |- |
Версия 08:26, 6 ноября 2015
Руководитель спецсеминара: д.ф.-м.н., профессор Дьяконов Александр Геннадьевич
Направления работы на спецсеминаре
См. также «Правила для постоянных участников». |
Информация для второкурсников! |
|
В рамках работы на спецсеминаре есть два направления исследования:
- Теоретическое. Проводится в рамках алгебраического подхода к решению задач распознавания. Суть подхода: на алгоритмах, которые решают задачи обработки и анализа данных, специальным образом вводятся алгебраические операции. Например, можно складывать алгоритмы (получается опять алгоритм), умножать и т. д. Среди получаемых алгебраических выражений над «естественными» алгоритмами есть высокоэффективные алгоритмы. На спецсеминаре рассматриваются вопросы: как их строить, анализировать, реализовывать на ЭВМ и т. д. и т. п. Здесь же возникают задачи современной теории интерполяции: построения функций специального вида, заданных частично. Можно заниматься дискретным направлением: решать подобные задачи для функций, принимающих значения 0 и 1. Данное направление представляет особую ценность студентам, которые хотят получить самостоятельные результаты в науке и продолжить обучение в аспирантуре.
- Прикладное. Решаются реальные прикладные задачи анализа данных (data mining). Например, построение рекомендательных систем, прогнозирование свойств динамических графов (в том числе и графов социальных сетей), прогнозирование поведения потребителей, анализ метаданных, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно).
Заседания спецсеминара
Заседания проходят по средам в ауд. 607, начало в 18:10. Вход свободный. |
Заседания 2015—2016 уч. года
Дата | Докладчик | Доклад | Материалы |
---|---|---|---|
16 сентября 2015 | Дьяконов Александр, руководитель | Устранение шума в анализе твитов, связь смежности и модулярности при разбиении графа | слайды (pdf) |
23 сентября 2015 | Остапец Андрей, аспирант | Решение конкурса Avito Context Ad Clicks | слайды (pdf), страница конкурса |
Нижибицкий Евгений, аспирант | A Neural Algorithm of Artistic Style или Deep Learning Salvation | слайды (pdf), статья (arxiv), реализация (github) | |
30 сентября 2015 | Кудрявцев Георгий, 4-й курс | Доклад по статье "RecSys Challenge 2015: ensemble learning with categorical features" | слайды (pdf), статья (arxiv) |
Рысьмятова Анастасия, 4-й курс | Character-level Convolutional Networks for Text Classification | слайды (pdf), статья (arxiv) | |
7 октября 2015 | Вихрева Мария, 4-й курс | Доклад по статье "Geographical effects on epidemic spreading in scale-free networks" | слайды (pdf), статья (arxiv) |
Севастопольский Артем, 3-й курс | Доклад о работах Hans-Peter Kriegel из университета Ludwig-Maximilians-Universität, Мюнхен | слайды (pdf), статья 1, статья 2 | |
14 октября 2015 | Каюмов Эмиль, 3-й курс | Доклад о работах Jure Leskovec из Стэнфордского университета | слайды (pdf), статья 1, статья 2 |
Никишин Евгений, 3-й курс | Доклад о работах Pedro Domingos из Вашингтонского университета | слайды (pdf), статья 1, статья 2 | |
21 октября 2015 | Трофимов Михаил, МФТИ | (Глубокое) обучение с подкреплением: от аркад до шахмат | статья1, статья2 |
Гущин Александр, МФТИ | Решение конкурса Flavours of physics | ||
28 октября 2015 | Остапец Андрей, аспирант | Доклад о диссертации Aris Kosmopoulos, посвященной иерархической классификации текстов | слайды (pdf), диссертация |
Нижибицкий Евгений, аспирант | DeepHear — Composing and harmonizing music with neural networks | ||
4 ноября 2015 | ПРАЗДНИК | ||
11 ноября 2015 | Кудрявцев Георгий, 4-й курс | ||
Рысьмятова Анастасия, 4-й курс | |||
18 ноября 2015 | Вихрева Мария, 4-й курс | ||
Севастопольский Артем, 3-й курс | Извлечение признаков из текстуры изображений | ||
25 ноября 2015 | Каюмов Эмиль, 3-й курс | Методы восстановления пропусков в данных | |
Никишин Евгений, 3-й курс | |||
2 декабря 2015 | Трофимов Михаил, МФТИ | ||
Гущин Александр, МФТИ | |||
9 декабря 2015 | Дьяконов Александр, руководитель |
Заседния в предыдущих семестрах:
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2014-2015 уч. года.
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2013-2014 уч. года (осенний семестр).
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (весенний семестр).
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (осенний семестр).
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2011-2012 уч. года (весенний семестр).
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2011-2012 уч. года (осенний семестр).
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2010-2011 уч. года (весенний семестр).
Текущие задания участников спецсеминара
Список источников для потенциальных докладов.
Доклады по статьям Доклады по авторам
|
Участник | Задание (каждый сам заполняет свою ячейку) | Комментарий |
---|---|---|
Нижибицкий Евгений (А1) | Подготовка плана-проспекта диссертации, статьи в журнале из списка ВАК (подача до декабря). | |
Остапец Андрей (А1) | Подготовка плана-проспекта диссертации, статьи в журнале из списка ВАК (подача до декабря). | |
Кудрявцев Георгий (417) | ВКР "Построение ансамбля алгоритмов рекомендаций". | |
Рысьмятова Анастасия (417) | ВКР "Использование сверточных нейронных сетей для задачи классификации текстов". | |
Вихрева Мария (417) | ВКР "Распространение эпидемий в графах". | |
Каюмов Эмиль (317) | Выбор задачи (Kaggle) для исследования. | |
Никишин Евгений (317) | Выбор задачи (Kaggle) для исследования. | |
Севастопольский Артём (317) | Выбор задачи (Kaggle) для исследования. | |
Трофимов Михаил (МФТИ) | ВКР "Обобщенные факторизационные машины" | |
Гущин Александр (МФТИ) | ||
Кибитова Валерия (517) |
Участники спецсеминара
Год выпуска | Участники |
---|---|
2016 бак |
Кудрявцев Георгий
Рысьмятова Анастасия
Вихрева Мария
|
2016 маг |
Трофимов Михаил
|
аспиранты 2 г.о. |
|
Выпускники спецсеминара
Год выпуска | Выпускники |
---|---|
Аспирант, 2010 |
Карпович Павел
Диссертация: «K-сингулярные системы точек в алгебраическом подходе к распознаванию образов» (2010, успешно защищена 18.02.2011 по специальности 01.01.09). |
2015 бак |
Славнов Константин
|
2015 |
Харациди Олег
|
2014 |
|
2013 |
Бобрик Ксения
Ермушева Александра
Кириллов Александр
Кондрашкин Дмитрий (перевёлся на другой спецсеминар)
|
2012 |
|
2010 |
Ахламченкова Ольга
Токарева (Одинокова) Евгения
|
2009 |
Власова Юлия
Логинов Вячеслав
Фёдорова Валентина
Чучвара Алексндра (бакалавр)
|
2008 |
Ломова Дарья
Вершкова Ирина
|
2007 |
Кнорре Анна
Карпович Павел
Сиваченко Евгений
|
2006 |
Ховратович (Курятникова) Татьяна
Мошин Николай
|
2005 |
Каменева Наталия
Силкин Леонид
|
Некоторые решаемые прикладные задачи
- Прогнозирование временных рядов По характеристикам процесса в прошлом предсказать поведение в будущем. Знание о прошлом может быть неполным или ошибочным. Типичный пример: прогнозирование денежных сумм, которые будут сниматься с банкомата в течение следующей недели.
- Классификация технических сигналов и сигналов головного мозга По описанию изменения некоторой характеристики процесса необходимо определить её класс. Например, по электрокортикограмме определить ментальное состояние человека. При этом обучающая выборка (данные, которые у нас есть) была собрана достаточно давно, а тестирование алгоритма будет проводиться потом (при изменённых внешних условиях, а следовательно, при изменённых характеристиках данных).
- Фильтрация спама Настроить спам-фильтр на некотором универсальном обучающем множестве (данных спам-ловушек) так, чтобы он хорошо работал на компьютере конкретного пользователя (без дополнительной донастройки).
- Иерархическая классификация текстов Написать алгоритм автоматической категоризации документов. Например, новостные рассылки необходимо распределить по каталогам «спорт/футбол», «спорт/биатлон», «музыка/концерты», «музыка/рок/исполнители» и т. д.
- Ранжирование документов на основе обучающего множества Написать алгоритм, который оценивает релевантность документа поисковому запросу. Для фиксированного запроса упорядочить документы (используя их признаковые описания) так, чтобы порядок отражал «адекватность» запроса.
- Прогноз связности графа социальной сети Предсказать изменения динамического графа социальной сети, в частности, появление новых рёбер.
- Прогнозирование успешности грантов и проектов По описанию заявки оценить перспективность выполнения данного проекта.
- Разработка рекомендательного алгоритма, который делает актуальные предложения купить какой-то товар, воспользоваться услугой или прочитать материал.
- Предсказывание визитов покупателей и сумм покупок для сети супермаркетов Разработка алгоритма, который предсказывает дату первого визита и сумму покупки каждого клиента.
- Оценка фотографий по метаданным Прогноз «интересности» фото-материалов на основе анализа названия, описания, GPS-координат съёмки и т.п.
- Задача кредитного скоринга Прогнозирование надёжности клиента банка по обязательствам выплаты процентов кредита.