Алгебра над алгоритмами и эвристический поиск закономерностей
Материал из MachineLearning.
Руководитель спецсеминара: д.ф.-м.н., профессор Дьяконов Александр Геннадьевич
Направления работы на спецсеминаре
См. также «Правила для постоянных участников». |
Информация для второкурсников! |
|
В рамках работы на спецсеминаре есть два направления исследования:
- Теоретическое. Проводится в рамках алгебраического подхода к решению задач распознавания. Суть подхода: на алгоритмах, которые решают задачи обработки и анализа данных, специальным образом вводятся алгебраические операции. Например, можно складывать алгоритмы (получается опять алгоритм), умножать и т. д. Среди получаемых алгебраических выражений над «естественными» алгоритмами есть высокоэффективные алгоритмы. На спецсеминаре рассматриваются вопросы: как их строить, анализировать, реализовывать на ЭВМ и т. д. и т. п. Здесь же возникают задачи современной теории интерполяции: построения функций специального вида, заданных частично. Можно заниматься дискретным направлением: решать подобные задачи для функций, принимающих значения 0 и 1. Данное направление представляет особую ценность студентам, которые хотят получить самостоятельные результаты в науке и продолжить обучение в аспирантуре.
- Прикладное. Решаются реальные прикладные задачи анализа данных (data mining). Например, построение рекомендательных систем, прогнозирование свойств динамических графов (в том числе и графов социальных сетей), прогнозирование поведения потребителей, анализ метаданных, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно).
Заседания спецсеминара
В осеннем семестре заседания будут проходить по четвергам в ауд. 637, начало в 18:00. Вход свободный. Начало - 29 сентября. |
Заседания 2016—2017 уч. года
Дата | Докладчик | Доклад | Материалы |
---|---|---|---|
29 сентября 2016 | Слипенчук Павел Владимирович, аспирант каф. ИУ-8 (Информационная безопасность) МГТУ им. Баумана; ведущий инжерен Департамента Безопасности Сбербанка, специалист по разработке систем фрод-мониторинга | «Информационная стеганография»
«Стеганография — это междисциплинарная наука и искусство сокрытия информации внутри другой информации. В эпоху активного развития вычислительной техники и BigData задачи стеганографии и противодействия стеганографии (стегоанализа) становяться все более и более актуальными. Отдельный интерес представляет собой синтез стеганографии и машинного обучения. В докладе будет объяснена актуальность стеганографии в XXI веке, будут приведены информационно-теоретческие модели стеганографических каналов передачи данных и высказан ряд авторских идей о синтезе стеганорафии и машинного обучения.» | слайды (pdf) |
6 октября 2016 | Никишин Евгений, студент 4-го курса | Asymmetric LSH for Sublinear Time Maximum Inner Product Search | слайды (pdf), статья |
Остапец Андрей, аспирант 3 г.о. | ACM RecSys Challenge 2016 | соревнование | |
13 октября 2016 | Севастопольский Артем, 4-й курс | Глубокие нейронные сети для сегментации изображений. Программирование нейронных сетей. | слайды (pdf) ipython notebook (Keras) статья 1 (FCN) статья 2 (U-Net) |
20 октября 2016 | Иванов Сергей, 3-й курс | Проверка гипотезы Birthday Effect | слайды (slideshare) |
Кудрявцев Георгий, студент 5 курса | Чат боты | ||
27 октября 2016 | Нижибицкий Евгений, аспирант 3 г.о. | Классификация текстов и категоризация объявлений с помощью нейронных сетей (конкурс Avito) | |
Каюмов Эмиль, 4-й курс | Обзор рекуррентных нейронных сетей и статьи Visualizing and Understanding Recurrent Networks | arxiv слайды (pdf) блог
| |
3 ноября 2016 | Трофимов Михаил, аспирант 1 г.о. | Квантовое машинное обучение | слайды arXiv лекция Ллойда |
Гурьянов Алексей, 6-й курс | Обучение с подкреплением | ||
10 ноября 2016 | Гетоева Аида, 5-й курс. | Определение припадка у людей с эпилепсией по ЭЭГ | |
Рысьмятова Анастасия, 5-й курс | Sequence Graph Transform (SGT): A Feature Extraction Function for Sequence Data Mining | arxiv
| |
24 ноября 2016 | Викулин Всеволод, 5-й курс | Машинное обучение в поиске. | |
Игнатов Алексей, 1-й курс асп. | Обучение с подкреплением. Обзор каким оно бывает. Несколько базовых алгоритмов |
| |
1 декабря 2016 | Кибитова Валерия, 6-й курс | Задачи классификации ЭКГ сигналов. | слайды.pdf |
Заседния в предыдущих семестрах:
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2016-2017 уч. года.
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2015-2016 уч. года.
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2014-2015 уч. года.
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2013—2014 уч. года (осенний семестр).
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (весенний семестр).
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (осенний семестр).
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2011-2012 уч. года (весенний семестр).
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2011-2012 уч. года (осенний семестр).
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2010-2011 уч. года (весенний семестр).
Текущие задания участников спецсеминара
Список источников для потенциальных докладов.
Доклады по статьям Доклады по авторам
|
Участник | Задание (каждый сам заполняет свою ячейку) | Комментарий |
---|---|---|
Нижибицкий Евгений (А3) | Подготовка плана-проспекта диссертации, статьи в журнале из списка ВАК (подача до декабря). | |
Остапец Андрей (А3) | Подготовка плана-проспекта диссертации, статьи в журнале из списка ВАК (подача до декабря). | |
Кудрявцев Георгий (517) | Выбор темы курсовой работы | |
Рысьмятова Анастасия (517) | Выбор темы для курсовой работы | |
Вихрева Мария (517) | Выбор темы для курсовой работы | |
Каюмов Эмиль (417) | Выявление ишемической болезни сердца по сигналам кардиограмм. | |
Никишин Евгений (417) | ВКР "Снижение размерности больших массивов данных" | |
Севастопольский Артём (417) | ВКР "Методы распознавания глаукомы на основе нейронных сетей" | |
Иванов Сергей (317) | КР "Методы детектирования и исследования аномалий" | |
Трофимов Михаил (МФТИ) | Подготовка плана-проспекта диссертации | |
Гущин Александр (МФТИ) | Выбор темы для ВКР | |
Кибитова Валерия (617) | МД "Анализ биомедицинских сигналов при помощи методов машинного обучения." | |
Гурьянов Алексей (617) | МД "Стратегии исследования окружений в обучении с подкреплением с непрерывным пространством состояний." | |
Игнатов Алексей (А1) | Выбор темы научной работы |
Участники спецсеминара
Год выпуска | Участники |
---|---|
2018 бак |
Иванов Сергей
|
2017 бак |
Никишин Евгений
Каюмов Эмиль
Севастопольский Артём
|
2018 маг |
Викулин Всеволод
Кудрявцев Георгий
Рысьмятова Анастасия
Вихрева Мария
|
2017 маг |
Кибитова Валерия
Гурьянов Алексей
|
аспиранты 1 г.о. |
Трофимов Михаил
|
аспиранты 3 г.о. |
|
Выпускники спецсеминара
Год выпуска | Выпускники |
---|---|
Аспирант, 2010 |
Карпович Павел
Диссертация: «K-сингулярные системы точек в алгебраическом подходе к распознаванию образов» (2010, успешно защищена 18.02.2011 по специальности 01.01.09). |
2015 бак |
Славнов Константин
|
2015 |
Харациди Олег
|
2014 |
|
2013 |
Бобрик Ксения
Ермушева Александра
Кириллов Александр
Кондрашкин Дмитрий (перевёлся на другой спецсеминар)
|
2012 |
|
2010 |
Ахламченкова Ольга
Токарева (Одинокова) Евгения
|
2009 |
Власова Юлия
Логинов Вячеслав
Фёдорова Валентина
Чучвара Алексндра (бакалавр)
|
2008 |
Ломова Дарья
Вершкова Ирина
|
2007 |
Кнорре Анна
Карпович Павел
Сиваченко Евгений
|
2006 |
Ховратович (Курятникова) Татьяна
Мошин Николай
|
2005 |
Каменева Наталия
Силкин Леонид
|
Некоторые решаемые прикладные задачи
- Прогнозирование временных рядов По характеристикам процесса в прошлом предсказать поведение в будущем. Знание о прошлом может быть неполным или ошибочным. Типичный пример: прогнозирование денежных сумм, которые будут сниматься с банкомата в течение следующей недели.
- Классификация технических сигналов и сигналов головного мозга По описанию изменения некоторой характеристики процесса необходимо определить её класс. Например, по электрокортикограмме определить ментальное состояние человека. При этом обучающая выборка (данные, которые у нас есть) была собрана достаточно давно, а тестирование алгоритма будет проводиться потом (при изменённых внешних условиях, а следовательно, при изменённых характеристиках данных).
- Фильтрация спама Настроить спам-фильтр на некотором универсальном обучающем множестве (данных спам-ловушек) так, чтобы он хорошо работал на компьютере конкретного пользователя (без дополнительной донастройки).
- Иерархическая классификация текстов Написать алгоритм автоматической категоризации документов. Например, новостные рассылки необходимо распределить по каталогам «спорт/футбол», «спорт/биатлон», «музыка/концерты», «музыка/рок/исполнители» и т. д.
- Ранжирование документов на основе обучающего множества Написать алгоритм, который оценивает релевантность документа поисковому запросу. Для фиксированного запроса упорядочить документы (используя их признаковые описания) так, чтобы порядок отражал «адекватность» запроса.
- Прогноз связности графа социальной сети Предсказать изменения динамического графа социальной сети, в частности, появление новых рёбер.
- Прогнозирование успешности грантов и проектов По описанию заявки оценить перспективность выполнения данного проекта.
- Разработка рекомендательного алгоритма, который делает актуальные предложения купить какой-то товар, воспользоваться услугой или прочитать материал.
- Предсказывание визитов покупателей и сумм покупок для сети супермаркетов Разработка алгоритма, который предсказывает дату первого визита и сумму покупки каждого клиента.
- Оценка фотографий по метаданным Прогноз «интересности» фото-материалов на основе анализа названия, описания, GPS-координат съёмки и т.п.
- Задача кредитного скоринга Прогнозирование надёжности клиента банка по обязательствам выплаты процентов кредита.