Алгебра над алгоритмами и эвристический поиск закономерностей

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Участники спецсеминара)
Строка 1: Строка 1:
Руководитель спецсеминара: д.ф.-м.н., профессор [[Участник:Dj|Дьяконов Александр Геннадьевич]]
Руководитель спецсеминара: д.ф.-м.н., профессор [[Участник:Dj|Дьяконов Александр Геннадьевич]]
 +
 +
== Направления работы на спецсеминаре ==
 +
 +
{{tip|
 +
См. также [[Алгебра над алгоритмами и эвристический поиск закономерностей/правила для постоянных участников|«Правила для постоянных участников»]].
 +
}}
{{TOCright}}
{{TOCright}}
-
== Работа на спецсеминаре ==
 
'''В рамках работы на спецсеминаре есть два направления исследования:'''
'''В рамках работы на спецсеминаре есть два направления исследования:'''
# '''Теоретическое.''' Проводится в рамках '''алгебраического подхода''' к решению задач распознавания. Суть подхода: на алгоритмах, которые решают задачи обработки и анализа данных, специальным образом вводятся алгебраические операции. Например, можно складывать алгоритмы (получается опять алгоритм), умножать и т. д. Среди получаемых алгебраических выражений над «естественными» алгоритмами есть высокоэффективные алгоритмы. На спецсеминаре рассматриваются вопросы: как их строить, анализировать, реализовывать на ЭВМ и т. д. и т. п. Здесь же возникают задачи '''современной теории интерполяции''': построения функций специального вида, заданных частично. Можно заниматься '''дискретным направлением''': решать подобные задачи для функций, принимающих значения 0 и 1. Данное направление представляет '''особую ценность студентам, которые хотят получить самостоятельные результаты в науке и продолжить обучение в аспирантуре'''.
# '''Теоретическое.''' Проводится в рамках '''алгебраического подхода''' к решению задач распознавания. Суть подхода: на алгоритмах, которые решают задачи обработки и анализа данных, специальным образом вводятся алгебраические операции. Например, можно складывать алгоритмы (получается опять алгоритм), умножать и т. д. Среди получаемых алгебраических выражений над «естественными» алгоритмами есть высокоэффективные алгоритмы. На спецсеминаре рассматриваются вопросы: как их строить, анализировать, реализовывать на ЭВМ и т. д. и т. п. Здесь же возникают задачи '''современной теории интерполяции''': построения функций специального вида, заданных частично. Можно заниматься '''дискретным направлением''': решать подобные задачи для функций, принимающих значения 0 и 1. Данное направление представляет '''особую ценность студентам, которые хотят получить самостоятельные результаты в науке и продолжить обучение в аспирантуре'''.
-
 
# '''Прикладное.''' Решаются реальные прикладные задачи анализа данных (data mining). Например, построение рекомендательных систем, прогнозирование свойств динамических графов (в том числе и графов социальных сетей), прогнозирование поведения потребителей, анализ метаданных, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно).
# '''Прикладное.''' Решаются реальные прикладные задачи анализа данных (data mining). Например, построение рекомендательных систем, прогнозирование свойств динамических графов (в том числе и графов социальных сетей), прогнозирование поведения потребителей, анализ метаданных, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно).
 +
 +
== Заседания спецсеминара ==
{{notice|
{{notice|
-
Заседания по средам в 609 ауд. в 16:40. Вход свободный.
+
Заседания проходят по средам в ауд. 609, начало в 16:40. Вход свободный.
}}
}}
-
 
-
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/правила для постоянных участников|ПРАВИЛА ДЛЯ ПОСТОЯННЫХ УЧАСТНИКОВ]].
 
-
 
-
== Заседания 2014—2015 уч. года ==
 
{| class="wikitable"
{| class="wikitable"
|-
|-
-
! Число
+
! Дата
! Докладчик
! Докладчик
! Доклад
! Доклад
! Материалы
! Материалы
|-
|-
-
| 17.09.14
+
| 17 сентября 2014
-
| '''Дьяконов Александр''' (рук)
+
| ''Дьяконов Александр'', руководитель
-
| Организационные вопросы, производственная практика, распределение тем докладов, темы курсовых и дипломных работ
+
| Организационные вопросы: производственная практика, курсовые и дипломные работы, распределение тем докладов
|
|
|-
|-
-
| 24.09.14
+
| 24 сентября 2014
 +
| ''Нижибицкий Евгений'', аспирант
 +
| '''Транскрипция музыкальных произведений методами машинного обучения''' (название уточняется)
|
|
 +
|-
 +
| 1 октября 2014
|
|
|
|
-
|}
 
-
 
-
== Возможные доклады ==
 
-
 
-
{| class="wikitable"
 
-
|-
 
-
! Источник
 
-
! Пояснение
 
-
! Возможные темы
 
-
|-
 
-
| [http://www.kaggle.com/ Kaggle]
 
-
| Как всегда - обзор свежих интересных задач.
 
-
|
 
-
|-
 
-
| [http://pca.narod.ru/ pca.narod.ru]
 
-
| Много материалов про многомерный метод главных компонент. Тем - куча. Можно походить по ссылкам - посмотреть смежные области.
 
-
|
 
-
|-
 
-
| [http://datascience101.wordpress.com/tag/julia/ julia tags]
 
-
| Обзор по современным языкам программирования для анализа данных. Особенно интересен новый язык Julia. Надо написать небольшие программки на разных языках. Сравнить производительность. Как доп. источник используйте гугл с запросами типа '''Julia data mining'''
 
-
|-
 
-
| [http://www.cs.cornell.edu/home/kleinber/ hp Kleinber]
 
-
| Много разных интересных статей и книг по графам, соцсетям, играм и т.п. В докладе можно изложить содержание 1-3 статей.
 
|
|
-
|-
 
-
| гугл: '''multi-dimensional sparse matrix''', '''multi-dimensional sparse svd'''
 
-
| Всё, что касается решения задач с факторными признаками.
 
-
| '''Многомерный метод SVD: алгоритмы и приложения'''
 
-
|-
 
-
| [http://tweettracker.fulton.asu.edu/tda/TwitterDataAnalytics.pdf Twitter Data Analytics] (pdf)
 
-
| Книгу следует рассматривать лишь как первоначальный источник. В докладе желательно более подробно осветить темы.
 
-
Есть два разных подхода: осветить технику или математический аппарат.
 
-
| '''Анализ сообщений в твитере'''
 
|}
|}
-
 
+
Заседния в предыдущих семестрах:
-
См. архив:
+
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2013-2014 уч. года | Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2013-2014 уч. года (осенний семестр)]].
-
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2013-2014 уч. года]].
+
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (весенний семестр)]].
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (весенний семестр)]].
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (осенний семестр)]].
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (осенний семестр)]].
Строка 77: Строка 50:
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2010-2011 уч. года (весенний семестр)]].
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2010-2011 уч. года (весенний семестр)]].
-
== Научная работа — задания ==
+
== Текущие задания участников спецсеминара ==
{| class="wikitable"
{| class="wikitable"
|-
|-
Строка 85: Строка 58:
|-
|-
| '''Нижибицкий Евгений''' (А1)
| '''Нижибицкий Евгений''' (А1)
-
|
+
| Подготовка доклада, обзор статей с последних конференций по теме видеотрекинга
|
|
|-
|-
Строка 97: Строка 70:
|-
|-
| '''Харациди Олег''' (517)
| '''Харациди Олег''' (517)
-
|
+
| Стажировка в Google Switzerland
|
|
|-
|-
Строка 111: Строка 84:
|
|
|
|
 +
|}
 +
 +
== Возможные темы для будущих докладов ==
 +
 +
{| class="wikitable"
 +
|-
 +
! Источник
 +
! Пояснение
 +
! Возможные темы
 +
|-
 +
| [http://www.kaggle.com/ Kaggle]
 +
| Как всегда - обзор свежих интересных задач.
 +
|
 +
|-
 +
| [http://pca.narod.ru/ pca.narod.ru]
 +
| Много материалов про многомерный метод главных компонент. Тем - куча. Можно походить по ссылкам - посмотреть смежные области.
 +
|
 +
|-
 +
| [http://datascience101.wordpress.com/tag/julia/ julia tags]
 +
| Обзор по современным языкам программирования для анализа данных. Особенно интересен новый язык Julia. Надо написать небольшие программки на разных языках. Сравнить производительность. Как доп. источник используйте гугл с запросами типа '''Julia data mining'''.
 +
|-
 +
| [http://www.cs.cornell.edu/home/kleinber/ hp Kleinber]
 +
| Много разных интересных статей и книг по графам, соцсетям, играм и т.п. В докладе можно изложить содержание 1-3 статей.
 +
|
 +
|-
 +
| гугл: '''multi-dimensional sparse matrix''', '''multi-dimensional sparse svd'''
 +
| Всё, что касается решения задач с факторными признаками.
 +
| '''Многомерный метод SVD: алгоритмы и приложения'''
 +
|-
 +
| [http://tweettracker.fulton.asu.edu/tda/TwitterDataAnalytics.pdf Twitter Data Analytics] (pdf)
 +
| Книгу следует рассматривать лишь как первоначальный источник. В докладе желательно более подробно осветить темы.
 +
Есть два разных подхода: осветить технику или математический аппарат.
 +
| '''Анализ сообщений в твитере'''
|}
|}
Строка 116: Строка 122:
{| border="1"
{| border="1"
-
!Год выпуска||Участники:
+
!Год выпуска ||Участники
|-
|-
|2015||
|2015||
Строка 164: Строка 170:
{| border="1"
{| border="1"
-
!Год выпуска||Выпускники:
+
!Год выпуска||Выпускники
|-
|-
|Аспирант, 2010||
|Аспирант, 2010||
'''Карпович Павел'''
'''Карпович Павел'''
* Карпович П. А. k-сингулярные системы точек в пространстве l1 // Сборник тезисов XVI Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2009», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2009. — C.34.
* Карпович П. А. k-сингулярные системы точек в пространстве l1 // Сборник тезисов XVI Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2009», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2009. — C.34.
-
* Карпович П. А. Эффективная реализация алгоритмов распознавания образов // Журнал вычислительной математики и математической физики, 2009, Т. 49, № 8. C.1510-1516
+
* Карпович П. А. Эффективная реализация алгоритмов распознавания образов // Журнал вычислительной математики и математической физики, 2009, Т. 49, № 8. C.1510-1516.
* Карпович П. А. О задаче разделения системы точек в пространсте l1 на подсистемы с невырождеными матрицами попарных расстояний // Тезисы конференции МФТИ, Секция проблем интеллектуального анализа данных, распознавания и прогнозирования. — М.: ГОУ ВПО «Московский физико-технический институт (государственный университет)», 2009. — С. 52.
* Карпович П. А. О задаче разделения системы точек в пространсте l1 на подсистемы с невырождеными матрицами попарных расстояний // Тезисы конференции МФТИ, Секция проблем интеллектуального анализа данных, распознавания и прогнозирования. — М.: ГОУ ВПО «Московский физико-технический институт (государственный университет)», 2009. — С. 52.
* Карпович П. А., Дьяконов А. Г. Критерий k-сингулярности систем точек в алгебраическом подходе к распознаванию // 14-я Всероссийская конференция «Математические методы распознавания образов» Владимирская обл., г. Суздаль, 21-26 сентября 2009 г.: Сборник докладов. — М. МАКС Пресс, 2009. С. 41-44.
* Карпович П. А., Дьяконов А. Г. Критерий k-сингулярности систем точек в алгебраическом подходе к распознаванию // 14-я Всероссийская конференция «Математические методы распознавания образов» Владимирская обл., г. Суздаль, 21-26 сентября 2009 г.: Сборник докладов. — М. МАКС Пресс, 2009. С. 41-44.
* Карпович П.А. Разделение системы точек на подмножества с невырожденными матрицами попарных расстояний // Материалы XVII Международной конференции студентов и аспирантов по фундаментальным наукам «Ломоносов 2010». – М.: Изд. отдел ВМиК МГУ, МАКС Пресс, 2010. – С. 87-88.
* Карпович П.А. Разделение системы точек на подмножества с невырожденными матрицами попарных расстояний // Материалы XVII Международной конференции студентов и аспирантов по фундаментальным наукам «Ломоносов 2010». – М.: Изд. отдел ВМиК МГУ, МАКС Пресс, 2010. – С. 87-88.
* Карпович П.А. Критерии k-сингулярности и разделение 1-сингулянрных систем // Вестник Московского университета. Секция 15. “Вычислительная математика и кибернетика” – 2010. № 4.
* Карпович П.А. Критерии k-сингулярности и разделение 1-сингулянрных систем // Вестник Московского университета. Секция 15. “Вычислительная математика и кибернетика” – 2010. № 4.
-
* Карпович П.А. Дьяконов А.Г. K-сингулярные системы точек, приложения в алгебраическом подходе к распознаванию // Тезисы докладов Международной научной конференции ИОИ-8 Кипр, Пафос - 2010
+
* Карпович П.А. Дьяконов А.Г. K-сингулярные системы точек, приложения в алгебраическом подходе к распознаванию // Тезисы докладов Международной научной конференции ИОИ-8 Кипр, Пафос - 2010.
-
'''Диссертация:''' «[http://alexanderdyakonov.narod.ru/avtokarpovich.pdf K-сингулярные системы точек в алгебраическом подходе к распознаванию образов]» (2010, ''успешно защищена 18.02.2011 по специальности 01.01.09'')
+
'''Диссертация:''' «[http://alexanderdyakonov.narod.ru/avtokarpovich.pdf K-сингулярные системы точек в алгебраическом подходе к распознаванию образов]» (2010, ''успешно защищена 18.02.2011 по специальности 01.01.09'').
|-
|-
|2014||
|2014||
-
 
-
'''[[Участник:Nizhibitsky|Нижибицкий Евгений]]'''
 
-
* Курсовая работа [[Media:NizhibitskyKurs.pdf|«'''Обзор методов классификации документов'''»]].
 
-
* Доклад [[Media:Nizhibitsky3Tasks13.pdf|«'''Три задачи прогноза на основе текстов'''»]].
 
-
* Курсовая работа «'''Методы прогнозирования на основе текстов'''».
 
-
* Доклад [[Media:Nizhibitsky_pf_slides.pdf|«'''Трекинг при помощи фильтра частиц'''»]].
 
-
* Доклад «'''Относительная перплексия как мера качества тематических моделей'''» на конференции «Ломоносов 2014» ([[Media:NizhibitskyLomonosovThesis14.pdf|тезис (pdf)]], [[Media:NizhibitskyLomonosovSlides14.pdf|презентация (pdf)]]).
 
-
* Дипломная работа [[Media:NizhibitskyDiplom.pdf|«'''Трекинг объектов на видео при помощи фильтра частиц'''»]].
 
-
* 3-е место в [http://smu.cs.msu.ru/activity/contests/diploma/2014 конкурсе дипломных работ 2014 года].
 
-
* Статья [[Media:NizhibitskyJmlda14.pdf|«'''Композиции признаков для видеотрекинга при помощи фильтра частиц'''»]].
 
-
 
-
'''[[Участник:MoRandi91|Остапец Андрей]]'''
 
-
* Курсовая работа [[Media:Course_Paper_Ostapets.pdf‎|«'''Обзор методов линейного регрессионного анализа'''»]].
 
-
* Доклад [[Медиа:Deep.pdf|«'''Deep Learning'''»]].
 
-
* Курсовая работа [[Медиа:Course_Ostapets_417.pdf‎|«'''Применение методов регрессионного анализа для решения задачи прогнозирования временных финансовых рядов'''»]].
 
-
* Доклад [[Media:Sensors.pdf|«'''Анализ сигналов сенсорных устройств'''»]].
 
-
* Остапец А.А Анализ сигналов сенсорных устройств // Сборник тезисов XXI Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2014». Издательский отдел факультета вычислительной математики и кибернетики МГУ имени М.В. Ломоносова, 2014. С. 41-43.
 
-
* Дипломная работа [[Media:2014_517_OstapetsAA.pdf|«'''Анализ сигналов сенсорных устройств'''»]].
 
'''[[Участник:Newo|Фонарев Александр]]'''
'''[[Участник:Newo|Фонарев Александр]]'''
* Курсовая работа [[Media:Fonarev.Overview_of_Boosting_Methods.pdf|'''«Обзор алгоритмов бустинга»''']].
* Курсовая работа [[Media:Fonarev.Overview_of_Boosting_Methods.pdf|'''«Обзор алгоритмов бустинга»''']].
-
* Доклад [[Media:Spellchecking.pdf|'''Исправление опечаток в поисковых запросах''']]
+
* Доклад [[Media:Spellchecking.pdf|'''Исправление опечаток в поисковых запросах''']].
'''[[Участник:Peter Romov|Ромов Петр Алексеевич]]'''
'''[[Участник:Peter Romov|Ромов Петр Алексеевич]]'''
-
раздолбай
+
* раздолбай
|-
|-
Строка 213: Строка 201:
'''Ермушева Александра'''
'''Ермушева Александра'''
* Курсовая работа «Простые алгоритмы коллаборативной фильтрации».
* Курсовая работа «Простые алгоритмы коллаборативной фильтрации».
-
* Тема преддипломной практики «Разработка контентных алгоритмов рекомендаций для видеосервиса»
+
* Тема преддипломной практики «Разработка контентных алгоритмов рекомендаций для видеосервиса».
-
* Дипломная работа «[https://dl.dropboxusercontent.com/u/15370951/diploma.pdf Задачи анализа данных с нестандартным функционалом качества]»
+
* Дипломная работа «[https://dl.dropboxusercontent.com/u/15370951/diploma.pdf Задачи анализа данных с нестандартным функционалом качества]».
'''Кириллов Александр'''
'''Кириллов Александр'''
Строка 221: Строка 209:
* Тема преддипломной практики «Задача оптимизации и моделирования при настройке рекомендательной системы».
* Тема преддипломной практики «Задача оптимизации и моделирования при настройке рекомендательной системы».
* Второе место на конкурсе Интернет-математика «[http://imat-relpred.yandex.ru/en Relevance Prediction Challenge]» (лучший результат среди российских участников).
* Второе место на конкурсе Интернет-математика «[http://imat-relpred.yandex.ru/en Relevance Prediction Challenge]» (лучший результат среди российских участников).
-
* [http://download.yandex.ru/company/mmp.pdf Figurnov M., Kirillov A. Linear combination of random forests for the Relevance Prediction Challenge — 2012]
+
* [http://download.yandex.ru/company/mmp.pdf Figurnov M., Kirillov A. Linear combination of random forests for the Relevance Prediction Challenge — 2012].
* Кириллов А. Н. Предсказание связности графа. // Сборник тезисов XIX Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2012». Секция «Вычислительная математика и кибернетика». М.: МАКС Пресс, 2012, с. 101—102.
* Кириллов А. Н. Предсказание связности графа. // Сборник тезисов XIX Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2012». Секция «Вычислительная математика и кибернетика». М.: МАКС Пресс, 2012, с. 101—102.
* Кириллов А. Н. Сравнение методов предсказания появления связей в графе. // Сборник докладов 9-й международной конференции «Интеллектуализация обработки информации-2012», М: Торус Пресс, 2012. — С. 629—632.
* Кириллов А. Н. Сравнение методов предсказания появления связей в графе. // Сборник докладов 9-й международной конференции «Интеллектуализация обработки информации-2012», М: Торус Пресс, 2012. — С. 629—632.
Строка 239: Строка 227:
* Тема преддипломной практики «Технология разработки рекомендательных систем».
* Тема преддипломной практики «Технология разработки рекомендательных систем».
* Второе место на конкурсе Интернет-математика «[http://imat-relpred.yandex.ru/en Relevance Prediction Challenge]» (лучший результат среди российских участников).
* Второе место на конкурсе Интернет-математика «[http://imat-relpred.yandex.ru/en Relevance Prediction Challenge]» (лучший результат среди российских участников).
-
* [http://download.yandex.ru/company/mmp.pdf Figurnov M., Kirillov A. Linear combination of random forests for the Relevance Prediction Challenge — 2012]
+
* [http://download.yandex.ru/company/mmp.pdf Figurnov M., Kirillov A. Linear combination of random forests for the Relevance Prediction Challenge — 2012].
* Фигурнов М. В. Линейная комбинация случайных лесов в задаче предсказания релевантности документов. // Сборник тезисов XIX Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2012». Секция «Вычислительная математика и кибернетика». М.: МАКС Пресс, 2012, с. 107—109.
* Фигурнов М. В. Линейная комбинация случайных лесов в задаче предсказания релевантности документов. // Сборник тезисов XIX Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2012». Секция «Вычислительная математика и кибернетика». М.: МАКС Пресс, 2012, с. 107—109.
* Фигурнов М. В., Кириллов А. Н. Линейная комбинация случайных лесов в задаче предсказания релевантности документов // Сборник докладов 9-й международной конференции «Интеллектуализация обработки информации-2012», М: Торус Пресс, 2012. — С. 648—651.
* Фигурнов М. В., Кириллов А. Н. Линейная комбинация случайных лесов в задаче предсказания релевантности документов // Сборник докладов 9-й международной конференции «Интеллектуализация обработки информации-2012», М: Торус Пресс, 2012. — С. 648—651.
Строка 245: Строка 233:
|2012||
|2012||
'''[[Участник:Platonova.Elena|Платонова Елена]]'''
'''[[Участник:Platonova.Elena|Платонова Елена]]'''
-
* Семестровая работа (5 семестр) «[[Муравьиные алгоритмы]]»
+
* Семестровая работа (5 семестр) «[[Муравьиные алгоритмы]]».
-
* Тема работы «Информационный поиск»
+
* Тема работы «Информационный поиск».
-
* Доклад [[Media:IR.pdf|«Классический информационный поиск: реализация и методы» (PDF, 1,78Мб)]]
+
* Доклад [[Media:IR.pdf|«Классический информационный поиск: реализация и методы» (PDF, 1,78Мб)]].
-
* Дипломная работа «Градиентные методы ранговой регрессии в информационном поиске»
+
* Дипломная работа «Градиентные методы ранговой регрессии в информационном поиске».
|-
|-
|2010||
|2010||
'''Ахламченкова Ольга'''
'''Ахламченкова Ольга'''
-
* Дипломная работа «Машинное обучение для ранжирования документов»
+
* Дипломная работа «Машинное обучение для ранжирования документов».
'''Токарева (Одинокова) Евгения'''
'''Токарева (Одинокова) Евгения'''
* Дипломная работа [[Media:Diplom2010TokarevaE.pdf| «Методы иерархической классификации текстов» (PDF, 5.16Мб)]].
* Дипломная работа [[Media:Diplom2010TokarevaE.pdf| «Методы иерархической классификации текстов» (PDF, 5.16Мб)]].
Строка 262: Строка 250:
* Власова Ю. В. Применение генетических алгоритмов в задаче классификации сигналов (приложение в BCI) // Доклады 14-й Всероссийской конференции «Математические методы распознавания образов», М.: МАКС Пресс, 2009, С. 96-99.
* Власова Ю. В. Применение генетических алгоритмов в задаче классификации сигналов (приложение в BCI) // Доклады 14-й Всероссийской конференции «Математические методы распознавания образов», М.: МАКС Пресс, 2009, С. 96-99.
'''Логинов Вячеслав'''
'''Логинов Вячеслав'''
-
* Дипломная работа «Прогнозирование временных рядов с помощью рекуррентных нейросетей с откликом»
+
* Дипломная работа «Прогнозирование временных рядов с помощью рекуррентных нейросетей с откликом».
'''Фёдорова Валентина'''
'''Фёдорова Валентина'''
-
* Дипломная работа «Локальные методы прогнозирования временных рядов»
+
* Дипломная работа «Локальные методы прогнозирования временных рядов».
* Федорова В. П. Локальные методы прогнозирования временных рядов // Сборник тезисов XVI Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2009», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2009. — C.87.
* Федорова В. П. Локальные методы прогнозирования временных рядов // Сборник тезисов XVI Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2009», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2009. — C.87.
'''Чучвара Алексндра''' (бакалавр)
'''Чучвара Алексндра''' (бакалавр)
-
* Квалификационная работа [[Media:Diplom2009Chuchvara.pdf| «Частичное машинное обучение в задачах классификации текстов» (PDF, 627 КБ)]]
+
* Квалификационная работа [[Media:Diplom2009Chuchvara.pdf| «Частичное машинное обучение в задачах классификации текстов» (PDF, 627 КБ)]].
|-
|-
|2008||
|2008||
'''Ломова Дарья'''
'''Ломова Дарья'''
-
* Дипломная работа «Выделение закономерностей во временных рядах методом анализа главных компонент»
+
* Дипломная работа «Выделение закономерностей во временных рядах методом анализа главных компонент».
'''Вершкова Ирина'''
'''Вершкова Ирина'''
-
* Дипломная работа «Локальная и глобальная согласованность в интеллектуальном анализе данных»
+
* Дипломная работа «Локальная и глобальная согласованность в интеллектуальном анализе данных».
|-
|-
|2007||
|2007||
'''Кнорре Анна'''
'''Кнорре Анна'''
-
* Дипломная работа «Надежность алгоритмов распознавания, основанных на синтезе дизъюнктивных нормальных форм»
+
* Дипломная работа «Надежность алгоритмов распознавания, основанных на синтезе дизъюнктивных нормальных форм».
'''Карпович Павел'''
'''Карпович Павел'''
-
* Дипломная работа «Эффективная реализация алгоритмов распознавания образов»
+
* Дипломная работа «Эффективная реализация алгоритмов распознавания образов».
'''Сиваченко Евгений'''
'''Сиваченко Евгений'''
-
* Дипломная работа «Нейросетевой поиск логических закономерностей»
+
* Дипломная работа «Нейросетевой поиск логических закономерностей».
|-
|-
|2006||
|2006||
'''Ховратович (Курятникова) Татьяна'''
'''Ховратович (Курятникова) Татьяна'''
-
* Дипломная работа «Критерии корректности в задачах распознавания образов с малым числом признаков»
+
* Дипломная работа «Критерии корректности в задачах распознавания образов с малым числом признаков».
* Курятникова Т. С. Критерии корректности алгебраического и линейного замыкания АВО для малых размерностей // Материалы XII Международной конференции студентов, аспирантов и молодых учёных «Ломоносов», секция «Вычислительная математика и кибернетика». М.: Изд. отд. ВМиК МГУ, 2006. — c. 32-33.
* Курятникова Т. С. Критерии корректности алгебраического и линейного замыкания АВО для малых размерностей // Материалы XII Международной конференции студентов, аспирантов и молодых учёных «Ломоносов», секция «Вычислительная математика и кибернетика». М.: Изд. отд. ВМиК МГУ, 2006. — c. 32-33.
'''Мошин Николай'''
'''Мошин Николай'''
-
* Дипломная работа «Эффективная реализация алгоритмов решения задачи выполнимости»
+
* Дипломная работа «Эффективная реализация алгоритмов решения задачи выполнимости».
|-
|-
|2005||
|2005||
'''Каменева Наталия'''
'''Каменева Наталия'''
-
* Дипломная работа «Эффективные логические алгоритмы распознавания, основанные на синтезе ДНФ»
+
* Дипломная работа «Эффективные логические алгоритмы распознавания, основанные на синтезе ДНФ».
'''Силкин Леонид'''
'''Силкин Леонид'''
-
* Дипломная работа «Оценка разделяющей способности признаков при кодировании информации в задачах распознавания»
+
* Дипломная работа «Оценка разделяющей способности признаков при кодировании информации в задачах распознавания».
|}
|}

Версия 10:53, 22 сентября 2014

Руководитель спецсеминара: д.ф.-м.н., профессор Дьяконов Александр Геннадьевич

Направления работы на спецсеминаре

См. также «Правила для постоянных участников».


Содержание

В рамках работы на спецсеминаре есть два направления исследования:

  1. Теоретическое. Проводится в рамках алгебраического подхода к решению задач распознавания. Суть подхода: на алгоритмах, которые решают задачи обработки и анализа данных, специальным образом вводятся алгебраические операции. Например, можно складывать алгоритмы (получается опять алгоритм), умножать и т. д. Среди получаемых алгебраических выражений над «естественными» алгоритмами есть высокоэффективные алгоритмы. На спецсеминаре рассматриваются вопросы: как их строить, анализировать, реализовывать на ЭВМ и т. д. и т. п. Здесь же возникают задачи современной теории интерполяции: построения функций специального вида, заданных частично. Можно заниматься дискретным направлением: решать подобные задачи для функций, принимающих значения 0 и 1. Данное направление представляет особую ценность студентам, которые хотят получить самостоятельные результаты в науке и продолжить обучение в аспирантуре.
  2. Прикладное. Решаются реальные прикладные задачи анализа данных (data mining). Например, построение рекомендательных систем, прогнозирование свойств динамических графов (в том числе и графов социальных сетей), прогнозирование поведения потребителей, анализ метаданных, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно).

Заседания спецсеминара

Заседания проходят по средам в ауд. 609, начало в 16:40. Вход свободный.


Дата Докладчик Доклад Материалы
17 сентября 2014 Дьяконов Александр, руководитель Организационные вопросы: производственная практика, курсовые и дипломные работы, распределение тем докладов
24 сентября 2014 Нижибицкий Евгений, аспирант Транскрипция музыкальных произведений методами машинного обучения (название уточняется)
1 октября 2014

Заседния в предыдущих семестрах:

Текущие задания участников спецсеминара

Участник Задание (каждый сам заполняет свою ячейку) Комментарий
Нижибицкий Евгений (А1) Подготовка доклада, обзор статей с последних конференций по теме видеотрекинга
Остапец Андрей (А1)
Рыжков Александр (517)
Харациди Олег (517) Стажировка в Google Switzerland
Славнов Константин (417)
Кудрявцев Георгий (317)
Рысьмятова Анастасия (317)

Возможные темы для будущих докладов

Источник Пояснение Возможные темы
Kaggle Как всегда - обзор свежих интересных задач.
pca.narod.ru Много материалов про многомерный метод главных компонент. Тем - куча. Можно походить по ссылкам - посмотреть смежные области.
julia tags Обзор по современным языкам программирования для анализа данных. Особенно интересен новый язык Julia. Надо написать небольшие программки на разных языках. Сравнить производительность. Как доп. источник используйте гугл с запросами типа Julia data mining.
hp Kleinber Много разных интересных статей и книг по графам, соцсетям, играм и т.п. В докладе можно изложить содержание 1-3 статей.
гугл: multi-dimensional sparse matrix, multi-dimensional sparse svd Всё, что касается решения задач с факторными признаками. Многомерный метод SVD: алгоритмы и приложения
Twitter Data Analytics (pdf) Книгу следует рассматривать лишь как первоначальный источник. В докладе желательно более подробно осветить темы.

Есть два разных подхода: осветить технику или математический аппарат.

Анализ сообщений в твитере

Участники спецсеминара

Год выпуска Участники
2015

Рыжков Александр

Харациди Олег

2015 бак

Славнов Константин

2016 бак

Кудрявцев Георгий

Рысьмятова Анастасия

аспиранты 1 г.о.

Нижибицкий Евгений

Остапец Андрей

Выпускники спецсеминара

Год выпускаВыпускники
Аспирант, 2010

Карпович Павел

  • Карпович П. А. k-сингулярные системы точек в пространстве l1 // Сборник тезисов XVI Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2009», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2009. — C.34.
  • Карпович П. А. Эффективная реализация алгоритмов распознавания образов // Журнал вычислительной математики и математической физики, 2009, Т. 49, № 8. C.1510-1516.
  • Карпович П. А. О задаче разделения системы точек в пространсте l1 на подсистемы с невырождеными матрицами попарных расстояний // Тезисы конференции МФТИ, Секция проблем интеллектуального анализа данных, распознавания и прогнозирования. — М.: ГОУ ВПО «Московский физико-технический институт (государственный университет)», 2009. — С. 52.
  • Карпович П. А., Дьяконов А. Г. Критерий k-сингулярности систем точек в алгебраическом подходе к распознаванию // 14-я Всероссийская конференция «Математические методы распознавания образов» Владимирская обл., г. Суздаль, 21-26 сентября 2009 г.: Сборник докладов. — М. МАКС Пресс, 2009. С. 41-44.
  • Карпович П.А. Разделение системы точек на подмножества с невырожденными матрицами попарных расстояний // Материалы XVII Международной конференции студентов и аспирантов по фундаментальным наукам «Ломоносов 2010». – М.: Изд. отдел ВМиК МГУ, МАКС Пресс, 2010. – С. 87-88.
  • Карпович П.А. Критерии k-сингулярности и разделение 1-сингулянрных систем // Вестник Московского университета. Секция 15. “Вычислительная математика и кибернетика” – 2010. № 4.
  • Карпович П.А. Дьяконов А.Г. K-сингулярные системы точек, приложения в алгебраическом подходе к распознаванию // Тезисы докладов Международной научной конференции ИОИ-8 Кипр, Пафос - 2010.

Диссертация: «K-сингулярные системы точек в алгебраическом подходе к распознаванию образов» (2010, успешно защищена 18.02.2011 по специальности 01.01.09).

2014

Фонарев Александр

Ромов Петр Алексеевич

  • раздолбай
2013

Бобрик Ксения

  • Тема работы «Прогнозирование временных рядов».

Ермушева Александра

Кириллов Александр

  • Курсовая работа «Матричное разложение в задаче анализа текстов».
  • Дипломная работа «Дизъюнктивные нормальные формы специального вида для функций с малым количеством нулей».
  • Тема преддипломной практики «Задача оптимизации и моделирования при настройке рекомендательной системы».
  • Второе место на конкурсе Интернет-математика «Relevance Prediction Challenge» (лучший результат среди российских участников).
  • Figurnov M., Kirillov A. Linear combination of random forests for the Relevance Prediction Challenge — 2012.
  • Кириллов А. Н. Предсказание связности графа. // Сборник тезисов XIX Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2012». Секция «Вычислительная математика и кибернетика». М.: МАКС Пресс, 2012, с. 101—102.
  • Кириллов А. Н. Сравнение методов предсказания появления связей в графе. // Сборник докладов 9-й международной конференции «Интеллектуализация обработки информации-2012», М: Торус Пресс, 2012. — С. 629—632.
  • Фигурнов М. В., Кириллов А. Н. Линейная комбинация случайных лесов в задаче предсказания релевантности документов // Сборник докладов 9-й международной конференции «Интеллектуализация обработки информации-2012», М: Торус Пресс, 2012. — С. 648—651.

Кондрашкин Дмитрий (перевёлся на другой спецсеминар)


Фигурнов Михаил

  • Курсовая работа «Метрические критерии k-сингулярности».
  • Дипломная работа «Системы точек с вырожденными матрицами попарных расстояний».
  • Тема преддипломной практики «Технология разработки рекомендательных систем».
  • Второе место на конкурсе Интернет-математика «Relevance Prediction Challenge» (лучший результат среди российских участников).
  • Figurnov M., Kirillov A. Linear combination of random forests for the Relevance Prediction Challenge — 2012.
  • Фигурнов М. В. Линейная комбинация случайных лесов в задаче предсказания релевантности документов. // Сборник тезисов XIX Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2012». Секция «Вычислительная математика и кибернетика». М.: МАКС Пресс, 2012, с. 107—109.
  • Фигурнов М. В., Кириллов А. Н. Линейная комбинация случайных лесов в задаче предсказания релевантности документов // Сборник докладов 9-й международной конференции «Интеллектуализация обработки информации-2012», М: Торус Пресс, 2012. — С. 648—651.
2012

Платонова Елена

2010

Ахламченкова Ольга

  • Дипломная работа «Машинное обучение для ранжирования документов».

Токарева (Одинокова) Евгения

2009

Власова Юлия

  • Дипломная работа «Генерация признаков в задаче классификации сигналов» (PDF, 929 КБ).
  • Власова Ю. В. Применение генетических алгоритмов в задаче классификации сигналов (приложение в BCI) // Сборник тезисов XVI Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2009», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2009. — C.17.
  • Власова Ю. В. Применение генетических алгоритмов в задаче классификации сигналов (приложение в BCI) // Доклады 14-й Всероссийской конференции «Математические методы распознавания образов», М.: МАКС Пресс, 2009, С. 96-99.

Логинов Вячеслав

  • Дипломная работа «Прогнозирование временных рядов с помощью рекуррентных нейросетей с откликом».

Фёдорова Валентина

  • Дипломная работа «Локальные методы прогнозирования временных рядов».
  • Федорова В. П. Локальные методы прогнозирования временных рядов // Сборник тезисов XVI Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2009», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2009. — C.87.

Чучвара Алексндра (бакалавр)

2008

Ломова Дарья

  • Дипломная работа «Выделение закономерностей во временных рядах методом анализа главных компонент».

Вершкова Ирина

  • Дипломная работа «Локальная и глобальная согласованность в интеллектуальном анализе данных».
2007

Кнорре Анна

  • Дипломная работа «Надежность алгоритмов распознавания, основанных на синтезе дизъюнктивных нормальных форм».

Карпович Павел

  • Дипломная работа «Эффективная реализация алгоритмов распознавания образов».

Сиваченко Евгений

  • Дипломная работа «Нейросетевой поиск логических закономерностей».
2006

Ховратович (Курятникова) Татьяна

  • Дипломная работа «Критерии корректности в задачах распознавания образов с малым числом признаков».
  • Курятникова Т. С. Критерии корректности алгебраического и линейного замыкания АВО для малых размерностей // Материалы XII Международной конференции студентов, аспирантов и молодых учёных «Ломоносов», секция «Вычислительная математика и кибернетика». М.: Изд. отд. ВМиК МГУ, 2006. — c. 32-33.

Мошин Николай

  • Дипломная работа «Эффективная реализация алгоритмов решения задачи выполнимости».
2005

Каменева Наталия

  • Дипломная работа «Эффективные логические алгоритмы распознавания, основанные на синтезе ДНФ».

Силкин Леонид

  • Дипломная работа «Оценка разделяющей способности признаков при кодировании информации в задачах распознавания».

Некоторые решаемые прикладные задачи

  • Прогнозирование временных рядов По характеристикам процесса в прошлом предсказать поведение в будущем. Знание о прошлом может быть неполным или ошибочным. Типичный пример: прогнозирование денежных сумм, которые будут сниматься с банкомата в течение следующей недели.
  • Классификация технических сигналов и сигналов головного мозга По описанию изменения некоторой характеристики процесса необходимо определить её класс. Например, по электрокортикограмме определить ментальное состояние человека. При этом обучающая выборка (данные, которые у нас есть) была собрана достаточно давно, а тестирование алгоритма будет проводиться потом (при изменённых внешних условиях, а следовательно, при изменённых характеристиках данных).
  • Фильтрация спама Настроить спам-фильтр на некотором универсальном обучающем множестве (данных спам-ловушек) так, чтобы он хорошо работал на компьютере конкретного пользователя (без дополнительной донастройки).
  • Иерархическая классификация текстов Написать алгоритм автоматической категоризации документов. Например, новостные рассылки необходимо распределить по каталогам «спорт/футбол», «спорт/биатлон», «музыка/концерты», «музыка/рок/исполнители» и т. д.
  • Ранжирование документов на основе обучающего множества Написать алгоритм, который оценивает релевантность документа поисковому запросу. Для фиксированного запроса упорядочить документы (используя их признаковые описания) так, чтобы порядок отражал «адекватность» запроса.
  • Прогноз связности графа социальной сети Предсказать изменения динамического графа социальной сети, в частности, появление новых рёбер.
  • Прогнозирование успешности грантов и проектов По описанию заявки оценить перспективность выполнения данного проекта.
  • Разработка рекомендательного алгоритма, который делает актуальные предложения купить какой-то товар, воспользоваться услугой или прочитать материал.
  • Предсказывание визитов покупателей и сумм покупок для сети супермаркетов Разработка алгоритма, который предсказывает дату первого визита и сумму покупки каждого клиента.
  • Оценка фотографий по метаданным Прогноз «интересности» фото-материалов на основе анализа названия, описания, GPS-координат съёмки и т.п.
  • Задача кредитного скоринга Прогнозирование надёжности клиента банка по обязательствам выплаты процентов кредита.
Личные инструменты