Алгебра над алгоритмами и эвристический поиск закономерностей

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(добавление ссылки на слайды с доклада и изменение в списке участников.)
Текущая версия (20:17, 28 октября 2019) (править) (отменить)
(Заседания 2019—2020 уч. года)
 
(182 промежуточные версии не показаны)
Строка 3: Строка 3:
== Направления работы на спецсеминаре ==
== Направления работы на спецсеминаре ==
-
{{tip|
 
-
См. также [[Алгебра над алгоритмами и эвристический поиск закономерностей/правила для постоянных участников|«Правила для постоянных участников»]].
 
-
}}
 
-
{{notice|
 
-
[[Алгебра над алгоритмами и эвристический поиск закономерностей/информация для второкурсников|'''Информация для второкурсников!''']]
 
-
}}
 
{{TOCright}}
{{TOCright}}
'''В рамках работы на спецсеминаре есть два направления исследования:'''
'''В рамках работы на спецсеминаре есть два направления исследования:'''
# '''Теоретическое.''' Проводится в рамках '''алгебраического подхода''' к решению задач распознавания. Суть подхода: на алгоритмах, которые решают задачи обработки и анализа данных, специальным образом вводятся алгебраические операции. Например, можно складывать алгоритмы (получается опять алгоритм), умножать и т. д. Среди получаемых алгебраических выражений над «естественными» алгоритмами есть высокоэффективные алгоритмы. На спецсеминаре рассматриваются вопросы: как их строить, анализировать, реализовывать на ЭВМ и т. д. и т. п. Здесь же возникают задачи '''современной теории интерполяции''': построения функций специального вида, заданных частично. Можно заниматься '''дискретным направлением''': решать подобные задачи для функций, принимающих значения 0 и 1. Данное направление представляет '''особую ценность студентам, которые хотят получить самостоятельные результаты в науке и продолжить обучение в аспирантуре'''.
# '''Теоретическое.''' Проводится в рамках '''алгебраического подхода''' к решению задач распознавания. Суть подхода: на алгоритмах, которые решают задачи обработки и анализа данных, специальным образом вводятся алгебраические операции. Например, можно складывать алгоритмы (получается опять алгоритм), умножать и т. д. Среди получаемых алгебраических выражений над «естественными» алгоритмами есть высокоэффективные алгоритмы. На спецсеминаре рассматриваются вопросы: как их строить, анализировать, реализовывать на ЭВМ и т. д. и т. п. Здесь же возникают задачи '''современной теории интерполяции''': построения функций специального вида, заданных частично. Можно заниматься '''дискретным направлением''': решать подобные задачи для функций, принимающих значения 0 и 1. Данное направление представляет '''особую ценность студентам, которые хотят получить самостоятельные результаты в науке и продолжить обучение в аспирантуре'''.
# '''Прикладное.''' Решаются реальные прикладные задачи анализа данных (data mining). Например, построение рекомендательных систем, прогнозирование свойств динамических графов (в том числе и графов социальных сетей), прогнозирование поведения потребителей, анализ метаданных, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно).
# '''Прикладное.''' Решаются реальные прикладные задачи анализа данных (data mining). Например, построение рекомендательных систем, прогнозирование свойств динамических графов (в том числе и графов социальных сетей), прогнозирование поведения потребителей, анализ метаданных, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно).
 +
 +
{{tip|
 +
См. также [[Алгебра над алгоритмами и эвристический поиск закономерностей/правила для постоянных участников|«Правила для постоянных участников»]].
 +
}}
== Заседания спецсеминара ==
== Заседания спецсеминара ==
{{notice|
{{notice|
-
Заседания проходят по средам в ауд. 607, начало в 18:10. Вход свободный.
+
В осеннем семестре 2019 года заседания будут проходить по понедельникам, начиная с 16 сентября, раз в две недели (через одну), начало в 18:20, ауд. 508. Вход свободный.
}}
}}
-
 
+
== Заседания 2019—2020 уч. года ==
-
== Заседания 2015—2016 уч. года ==
+
Расписание доступно по [https://docs.google.com/spreadsheets/d/1ltdgH2T6hn959LPdpUfIrLKRzVBCpP7vNNyZnMbzalI/edit?usp=sharing ссылке].
{| class="wikitable"
{| class="wikitable"
Строка 29: Строка 27:
! Доклад
! Доклад
! Материалы
! Материалы
 +
|-
|-
-
| 16 сентября 2015
+
| 16 сентября 2019
-
| ''Дьяконов Александр'', руководитель
+
| ''Иванов Сергей Максимович'' (617)
-
| <!-- Организационные вопросы: производственная практика, курсовые и дипломные работы, распределение тем докладов
+
| '''Метод обратного распространения ошибки'''
-
Доклад о работах Карла Мейера из университета Северной Каролины:--> '''Устранение шума в анализе твитов, связь смежности и модулярности при разбиении графа'''
+
 
-
| [https://alexanderdyakonov.files.wordpress.com/2015/09/ss2015_dyakonov_meyer1.pdf слайды (pdf)]
+
Пытаемся навести порядок в математике, стоящей за концепцией обучения нейросетей.
 +
| [[Media:1._Backprop.pdf|слайды]]
 +
 
|-
|-
-
| rowspan=2| 23 сентября 2015
+
| 16 сентября 2019
-
| ''Остапец Андрей'', аспирант
+
| ''Иванов Сергей Максимович'' (617)
-
| Решение конкурса '''Avito Context Ad Clicks'''
+
| '''Задачи глубинного обучения'''
-
| [[Медиа:Ostapets_avito.pdf|слайды (pdf)]], [https://www.kaggle.com/c/avito-context-ad-clicks страница конкурса]
+
 
 +
Рассматриваем, какие задачи можно решать при помощи методов глубинного обучения.
 +
 
 +
|[[Media:2._DL_tasks.pdf|слайды]]
 +
 
|-
|-
-
| ''Нижибицкий Евгений'', аспирант
+
| 30 сентября 2019
-
| '''A Neural Algorithm of Artistic Style или Deep Learning Salvation'''
+
| ''Думбай Алексей Дмитриевич'' (617)
-
| [http://nizhib.com/neural_art.pdf слайды (pdf)], [http://arxiv.org/abs/1508.06576 статья (arxiv)], [https://github.com/andersbll/neural_artistic_style реализация (github)]
+
| '''Python. Подходы, приемы, интересные факты.'''
 +
 
 +
| [[Media:Dumbaj_python.pdf|слайды]]
 +
 
|-
|-
-
| rowspan=2|30 сентября 2015
+
| 28 октября 2019
-
| ''Кудрявцев Георгий'', 4-й курс
+
| ''Иванов Сергей Максимович'' (617)
-
| '''Доклад по статье "RecSys Challenge 2015: ensemble learning with categorical features"'''
+
| '''Трансформер'''
-
| [http://www.machinelearning.ru/wiki/images/0/07/Presentation_30_sep.pdf слайды (pdf)], [http://delivery.acm.org/10.1145/2820000/2813510/a1-romov.pdf?ip=85.89.127.25&id=2813510&acc=OPEN&key=4D4702B0C3E38B35%2E4D4702B0C3E38B35%2E4D4702B0C3E38B35%2E6D218144511F3437&CFID=552912043&CFTOKEN=51198344&__acm__=1444741980_e6720a35df61509938098c88f7beecc6 статья (arxiv)]
+
 
 +
| [[Media:Transformer.pdf|слайды]]
 +
 
|-
|-
-
| ''Рысьмятова Анастасия'', 4-й курс
+
| 28 октября 2019
-
|'''Character-level Convolutional Networks for Text Classification'''
+
-
|[http://www.machinelearning.ru/wiki/images/a/a9/Rysmyatova_report.pdf слайды (pdf)], [http://arxiv.org/pdf/1509.01626v2.pdf статья (arxiv)]
+
-
|-
+
-
| rowspan=2|7 октября 2015
+
-
| ''Вихрева Мария'', 4-й курс
+
-
| Доклад по статье '''"Geographical effects on epidemic spreading in scale-free networks"'''
+
-
|[http://www.machinelearning.ru/wiki/images/7/76/Epidemic_spreading_in_SF_networks.pdf слайды (pdf)], [http://arxiv.org/pdf/physics/0606256v1.pdf статья (arxiv)]
+
-
|-
+
-
| ''Севастопольский Артем'', 3-й курс
+
-
| Доклад о работах '''Hans-Peter Kriegel''' из университета Ludwig-Maximilians-Universität, Мюнхен
+
-
| [http://www.machinelearning.ru/wiki/images/4/4e/Sevastopolsky_-_report_H-P_Kriegel.pdf слайды (pdf)], [http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.71.1980 статья 1], [http://www.researchgate.net/publication/230692606_Discovering_Global_and_Local_Bursts_in_a_Stream_of_News статья 2]
+
-
|-
+
-
| rowspan=2|14 октября 2015
+
-
| ''Каюмов Эмиль'', 3-й курс
+
-
| Доклад о работах '''Jure Leskovec''' из Стэнфордского университета
+
-
| [http://www.machinelearning.ru/wiki/images/3/38/About_articles_of_jure_leskovec_14.10.2015.pdf слайды (pdf)], [http://cs.stanford.edu/people/jure/pubs/powergrowth-kdd05.pdf статья 1], [http://cs.stanford.edu/people/jure/pubs/trolls-icwsm15.pdf статья 2]
+
-
|-
+
-
| ''Никишин Евгений'', 3-й курс
+
-
| Доклад о работах '''Pedro Domingos''' из Вашингтонского университета
+
-
| [http://www.machinelearning.ru/wiki/images/c/c2/Nikishin_-_Report_on_Domingos.pdf слайды (pdf)], [http://web.cs.wpi.edu/~cs525/f13b-EAR/cs525-homepage/lectures/PAPERS/p71-domingos.pdf статья 1], [http://arxiv.org/pdf/1202.3732.pdf статья 2]
+
-
|-
+
-
| rowspan=2|21 октября 2015
+
-
| ''Трофимов Михаил'', МФТИ
+
-
| ''' (Глубокое) обучение с подкреплением: от аркад до шахмат'''
+
-
|[http://gitxiv.com/posts/rng7gKHtjbqTQz5op/giraffe-using-deep-reinforcement-learning-to-play-chess статья1], [https://www.cs.toronto.edu/~vmnih/docs/dqn.pdf статья2]
+
-
|-
+
-
| ''Гущин Александр'', МФТИ
+
-
| Решение конкурса '''Flavours of physics'''
+
-
|
+
-
|-
+
-
| rowspan=2|28 октября 2015
+
-
| ''Остапец Андрей'', аспирант
+
-
| Доклад о диссертации '''Aris Kosmopoulos''', посвященной иерархической классификации текстов
+
-
| [[Медиа:Presentation phd lshtc.pdf|слайды (pdf)]], [http://nlp.cs.aueb.gr/theses/akosmopoulos_phd_thesis.pdf диссертация]
+
-
|-
+
-
| ''Нижибицкий Евгений'', аспирант
+
-
| '''DeepHear — Composing and harmonizing music with neural networks'''
+
-
|
+
-
|-
+
-
| 4 ноября 2015
+
-
|
+
-
| ''ПРАЗДНИК''
+
-
|
+
-
|-
+
-
| rowspan=2|11 ноября 2015
+
-
| ''Кудрявцев Георгий'', 4-й курс
+
-
| '''CLiMF и OrdRec'''
+
-
| [[Медиа:CliMF.pdf|статья (pdf)]], [[Медиа:OrdRec.pdf|статья (pdf)]]
+
-
|
+
-
|-
+
-
| ''Рысьмятова Анастасия'', 4-й курс
+
-
|'''A Sensitivity Analysis of Convolutional Neural Networks for Sentence Classification'''
+
-
| [http://arxiv.org/pdf/1510.03820v2.pdf статья 1 (arxiv)] [http://arxiv.org/pdf/1408.5882v2.pdf статья 2 (arxiv)]
+
-
|-
+
-
| rowspan=2|18 ноября 2015
+
-
| ''Вихрева Мария'', 4-й курс
+
-
|'''Анализ настроения текста'''
+
-
|
+
-
|-
+
-
| ''Севастопольский Артем'', 3-й курс
+
-
| '''Извлечение признаков из текстуры изображений'''
+
-
| [http://www.machinelearning.ru/wiki/images/1/1d/Textures_slides_Sevastopolsky.pdf слайды (pdf)] [https://www.cs.auckland.ac.nz/~georgy/research/texture/thesis-html/thesis.html статья 1] [http://haralick.org/journals/TexturalFeatures.pdf статья 2 (pdf)] [http://www.cs.berkeley.edu/~malik/papers/LM-3dtexton.pdf статья 3 (pdf)]
+
-
|-
+
-
| rowspan=2|25 ноября 2015
+
-
| ''Каюмов Эмиль'', 3-й курс
+
-
| '''Методы восстановления пропусков в данных'''
+
-
| [http://www.machinelearning.ru/wiki/images/4/48/Methods_for_missing_value.pdf слайды (pdf)]
+
-
|-
+
-
| ''Никишин Евгений'', 3-й курс
+
-
| Доклад о современных '''методах выделения сообществ''' в социальных графах
+
-
| [http://www.machinelearning.ru/wiki/images/4/4a/Nikishin_-_modern_community_detection_algorithms.pdf слайды (pdf)], [http://arxiv.org/pdf/1308.3508.pdf статья 1], [http://wwwconference.org/proceedings/www2014/proceedings/p225.pdf статья 2], [http://arxiv.org/pdf/1212.0146.pdf статья 3]
+
-
|-
+
-
| rowspan=2|2 декабря 2015
+
-
| ''Трофимов Михаил'', МФТИ
+
|
|
-
|
 
-
|-
 
-
| ''Гущин Александр'', МФТИ
 
-
| Решение конкурса '''Springleaf marketing response'''
 
-
|
 
-
|-
 
-
| 9 декабря 2015
 
-
| ''Дьяконов Александр'', руководитель
 
|
|
 +
|
|
 +
|-
 +
|}
|}
-
 
Заседния в предыдущих семестрах:
Заседния в предыдущих семестрах:
 +
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2018-2019 уч. года]].
 +
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2016-2017 уч. года]].
 +
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2015-2016 уч. года]].
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2014-2015 уч. года]].
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2014-2015 уч. года]].
-
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2013-2014 уч. года | Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2013-2014 уч. года (осенний семестр)]].
+
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2013-2014 уч. года | Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2013—2014 уч. года (осенний семестр)]].
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (весенний семестр)]].
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (весенний семестр)]].
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (осенний семестр)]].
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (осенний семестр)]].
Строка 150: Строка 83:
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2010-2011 уч. года (весенний семестр)]].
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2010-2011 уч. года (весенний семестр)]].
-
== Текущие задания участников спецсеминара ==
+
== Участники прошлых лет ==
-
{{tip|
+
{| border="1"
-
Список источников для потенциальных докладов.
+
!Год выпуска ||Участники
-
'''Доклады по статьям'''
+
-
* http://jmlr.org/proceedings/
+
-
* https://nips.cc/Conferences/2015/AcceptedPapers
+
-
'''Доклады по авторам'''
+
-
* Hans-Peter Kriegel [[https://scholar.google.de/citations?user=DBf9LC4AAAAJ&hl=de%7C]]
+
-
* Pedro Domingos http://homes.cs.washington.edu/~pedrod/
+
-
* Samory Kpotufe http://www.princeton.edu/~samory/
+
-
* Randal Olson http://www.randalolson.com/publications/
+
-
* Jure Leskovec http://cs.stanford.edu/people/jure/
+
-
}}
+
-
 
+
-
{| class="wikitable"
+
|-
|-
-
! Участник
+
|2018 бак||
-
! Задание (каждый сам заполняет свою ячейку)
+
-
! Комментарий
+
-
|-
+
-
| '''Нижибицкий Евгений''' (А1)
+
-
| Подготовка плана-проспекта диссертации, статьи в журнале из списка ВАК (подача до декабря).
+
-
|
+
-
|-
+
-
| '''Остапец Андрей''' (А1)
+
-
| Подготовка плана-проспекта диссертации, статьи в журнале из списка ВАК (подача до декабря).
+
-
|
+
-
|-
+
-
| '''Кудрявцев Георгий''' (417)
+
-
| ВКР "Построение ансамбля алгоритмов рекомендаций".
+
-
|
+
-
|-
+
-
| '''Рысьмятова Анастасия''' (417)
+
-
| ВКР "Использование сверточных нейронных сетей для задачи классификации текстов".
+
-
|
+
-
|-
+
-
| '''Вихрева Мария''' (417)
+
-
| ВКР "Распространение эпидемий в графах".
+
-
|
+
-
|-
+
-
| '''Каюмов Эмиль''' (317)
+
-
| Выбор задачи (Kaggle) для исследования.
+
-
|
+
-
|-
+
-
| '''Никишин Евгений''' (317)
+
-
| Выбор задачи (Kaggle) для исследования.
+
-
|
+
-
|-
+
-
| '''Севастопольский Артём''' (317)
+
-
| Выбор задачи (Kaggle) для исследования.
+
-
|
+
-
|-
+
-
| '''Трофимов Михаил''' (МФТИ)
+
-
| ВКР "Обобщенные факторизационные машины"
+
-
|
+
-
|-
+
-
| '''Гущин Александр''' (МФТИ)
+
-
|
+
-
|
+
-
|-
+
-
|'''Кибитова Валерия''' (517)
+
-
|
+
-
|
+
-
|}
+
-
== Участники спецсеминара ==
+
'''Иванов Сергей'''
-
 
+
* Доклад [http://www.slideshare.net/SergeyIvanov105/birthday-effect-67829860/ «'''Проверка гипотезы Birthday Effect'''»]
-
{| border="1"
+
* Курсовая работа [[Media:AnomalyDetectionMethods.pdf|«'''Методы Детектирования Аномалий'''»]].
-
!Год выпуска ||Участники
+
* Дипломная работа [[Media:2018_417_IvanovSM.pdf|«'''Нейросетевая генерация музыки'''»]]
|-
|-
|2017 бак||
|2017 бак||
Строка 226: Строка 100:
* Доклад [[Media:Nikishin_-_Report_on_Domingos.pdf|«'''Работы Pedro Domingos'''»]].
* Доклад [[Media:Nikishin_-_Report_on_Domingos.pdf|«'''Работы Pedro Domingos'''»]].
* Доклад [[Media:Nikishin_-_modern_community_detection_algorithms.pdf|«'''Современные методы выделения сообществ в социальных графах'''»]].
* Доклад [[Media:Nikishin_-_modern_community_detection_algorithms.pdf|«'''Современные методы выделения сообществ в социальных графах'''»]].
 +
* Курсовая работа [[Media:Nikishin_coursework_community_detection.pdf|«'''Методы выделения сообществ в социальных графах'''»]].
 +
* Преддипломная практика «Поиск информативных признаковых описаний исполняемых файлов и подходящих методов машинного обучения для детектирования вредоносных объектов».
 +
* Доклад [[Media:ALSH_for_MIPS.pdf|«'''Asymmetric LSH for Sublinear Time Maximum Inner Product Search'''»]].
 +
* ВКР [https://drive.google.com/file/d/0B82NsCJgJ5GdN2xoWGJfbjlKWW8/view?usp=sharing «'''Снижение размерности больших массивов данных'''»].
'''Каюмов Эмиль'''
'''Каюмов Эмиль'''
-
* Доклад [[Media:About_articles_of_jure_leskovec_14.10.2015.pdf|«'''Доклад о работах Jure Leskovec из Стэнфордского университета'''»]].
+
* [[Media:About_articles_of_jure_leskovec_14.10.2015.pdf|'''Доклад о работах Jure Leskovec из Стэнфордского университета''']].
* Доклад [[Media:Methods_for_missing_value.pdf|«'''Методы восстановления пропусков в данных'''»]].
* Доклад [[Media:Methods_for_missing_value.pdf|«'''Методы восстановления пропусков в данных'''»]].
 +
* Курсовая работа [[Media:Kayumov_course_work_imputer_methods.pdf‎|«'''Методы восстановления пропусков в данных'''»]].
 +
* Преддипломная практика «Разработка модуля кластеризации запросов и ответов веб-ресурса для выявления бизнес-логики в составе системы обнаружения атак на веб-приложения».
 +
* Доклад [[Media:Rnn_and_visualizing_networks_27.10.2016.pdf|«'''Обзор рекуррентных нейронных сетей и статьи Visualizing and Understanding Recurrent Networks'''»]].
 +
* ВКР [[Media:Kayumov_diploma_mcnn_cardio_feature_extraction.pdf|«'''Автоматическое выделение признаков в сигналах кардиограмм в задаче выявления болезней сердца'''»]]
'''Севастопольский Артём'''
'''Севастопольский Артём'''
-
* Доклад
+
* [[Media:Sevastopolsky_-_report_H-P_Kriegel.pdf|'''Доклад о работах Hans-Peter Kriegel из университета Ludwig-Maximilians-Universität''']].
-
* Доклад
+
* Доклад [[Media:Textures_slides_Sevastopolsky.pdf|«'''Извлечение признаков из текстуры изображений'''»]].
 +
* Доклад [[Media:Retinopathy_-_Presentation.pdf|«'''Построение признаков снимков глазного дна для диагностики болезней глаз'''»]].
 +
* Курсовая работа [[Media:Coursework_-_Retinopathy.pdf|«'''Построение признаков снимков глазного дна для диагностики болезней глаз'''»]].
 +
* Преддипломная практика «Реализация детектора ключевых точек лица на основе композиции карт глубин и текстуры при помощи глубоких свёрточных нейронных сетей».
 +
* Доклад [[Media:NN_for_segmentation_and_Keras.pdf|«'''Глубокие нейронные сети для сегментации изображений.''']] [http://nbviewer.jupyter.org/github/seva100/seminar-talks/blob/master/Overview%20of%20Keras%20library%20for%20Python/Keras%20tutorial-precomputed.ipynb '''Программирование нейронных сетей.'''»]
 +
* ВКР [[Media:Diploma_Sevastopolsky_A.pdf|«'''Методы распознавания глаукомы на основе нейронных сетей'''»]]
|-
|-
-
|2016 бак||
+
|2018 маг||
 +
'''Викулин Всеволод'''
 +
* Курсовая работа [[Медиа:CourseVikulin.pdf|«'''Автоматическое выделение признаков в задаче классификации сигналов'''»]].
'''Кудрявцев Георгий'''
'''Кудрявцев Георгий'''
* Курсовая работа [[Media:CourseGeorge.pdf|«'''Методы сравнения траекторий'''»]].
* Курсовая работа [[Media:CourseGeorge.pdf|«'''Методы сравнения траекторий'''»]].
Строка 241: Строка 130:
* Доклад «'''Закон Бенфорда'''».
* Доклад «'''Закон Бенфорда'''».
'''Рысьмятова Анастасия'''
'''Рысьмятова Анастасия'''
 +
* Доклад [[Media:Anastasya_Rysmyatova_econometr.pdf|«'''Основы эконометрики'''»]].
 +
* Доклад [[Media:Anastasya_Rysmyatova_reklama.pdf|«'''Выявление мошенничества с кликами в интернет-рекламе'''»]].
* Курсовая работа [[Media:RysmyatovaCourseFile.pdf|«'''Методы отбора признаков'''»]].
* Курсовая работа [[Media:RysmyatovaCourseFile.pdf|«'''Методы отбора признаков'''»]].
-
* Доклад «'''Основы эконометрики'''».
 
-
* Доклад «'''Выявление мошенничества с кликами в интернет-рекламе'''».
 
* Доклад [[Media:Rysmyatova_report.pdf|«'''Классификация текстов'''»]].
* Доклад [[Media:Rysmyatova_report.pdf|«'''Классификация текстов'''»]].
 +
* Доклад [[Media:Anastasya_Rysmyatova_analiz.pdf|«'''Анализ чувствительность сверточных нейронных сетей'''»]].
 +
* Преддипломная практика [[Media:Anastasya_Rysmyatova_preddiplom.pdf|«'''Прикладные задачи анализа данных'''»]].
 +
* ВКР [[Media:Anastasya_Rysmyatova_diplom.pdf|«'''Использование сверточных нейронных сетей для задачи классификации текстов'''»]].
 +
* Курсовая работа [[Media:Kursov_517.pdf|«'''Ранжирование текстов литературных произведений'''»]].
'''Вихрева Мария'''
'''Вихрева Мария'''
* Курсовая работа [[Медиа:CourseVikhreva.pdf|«'''Dependency detection with Bayesian Networks'''»]].
* Курсовая работа [[Медиа:CourseVikhreva.pdf|«'''Dependency detection with Bayesian Networks'''»]].
* Доклад [[Media:Vikhreva_Feature_Selection.pdf|«'''Отбор признаков в графе'''»]].
* Доклад [[Media:Vikhreva_Feature_Selection.pdf|«'''Отбор признаков в графе'''»]].
* Доклад [[Media:Epidemic_spreading_in_SF_networks.pdf|«'''Распространение эпидемий в безмасштабных сетях'''»]].
* Доклад [[Media:Epidemic_spreading_in_SF_networks.pdf|«'''Распространение эпидемий в безмасштабных сетях'''»]].
 +
* Доклад [[Media:Анализ_настроения_текстов.pdf|«'''Анализ настроения текста'''»]].
 +
* Преддипломная практика [[Media:Преддипломная_практика.pdf|«'''Анализ геопространственных агрегированных данных'''»]].
 +
* Доклад [[Media:Deep Hack.pdf|«'''Решение хакатона Q&A DeepHack по Allen AI Challenge'''»]].
 +
* ВКР [[Media:Diploma.pdf|"Распространение эпидемий в графах"]]
 +
* Вихрева М. В. Распространение новостей в социальной сети // Сборник тезисов XXIII Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2016», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2016. — C.123.
 +
 +
|-
 +
|2017 маг||
 +
 +
'''Кибитова Валерия'''
 +
* Доклад «'''Методы распознавания сарказма в тексте'''».
 +
* Курсовая работа [[Media:Course_work_Kibitova.pdf| «'''Методы распознавания сарказма в тексте'''»]].
 +
* Магистерская диссертация [[Media:MD_GURIANOVA_VN.pdf| «'''Ансамбль алгоритмов для определения ишемической болезни сердца по электрокардиограмме'''»]].
 +
 +
'''Гурьянов Алексей'''
 +
* Магистерская диссертация [[Media:Guryanov2017.pdf| «'''Стратегии исследования окружений в обучении с подкреплением с непрерывным пространством состояний'''»]].
|-
|-
-
|2016 маг||
+
|аспиранты 1 г.о.||
'''Трофимов Михаил'''
'''Трофимов Михаил'''
-
* Доклад «'''Факторизационные машины'''» [https://www.dropbox.com/s/nnr1d0s0tand0ru/FM_Trofimov.pdf?dl=0 слайды].
+
* Доклад [https://www.dropbox.com/s/de1lnomry4l9pi4/qml.pdf?dl=0 «'''Квантовое машинное обучение'''»].
-
* Трофимов М. И. Использование нелинейный смесей экспертов в задачах классификации // Сборник тезисов XXII Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2015». Издательский отдел факультета вычислительной математики и кибернетики МГУ имени М. В. Ломоносова, 2015. С. 71-72.
+
* Дипломная работа [https://vk.com/away.php?utf=1&to=https%3A%2F%2Fsourceforge.net%2Fp%2Fmlalgorithms%2Fcode%2FHEAD%2Ftree%2FGroup074%2FTrofimov2016MSThesis%2Fdiploma.pdf%3Fformat%3Draw «'''Обобщённые факторизационные машины'''»].
 +
* Доклад [https://www.dropbox.com/s/90xm8784bswf875/llr-fm-slides.pdf?dl=0 «'''Локально низкоранговая факторизационная машина'''»].
 +
* Доклад [https://www.dropbox.com/s/pqd1ynrmrlpzx11/Trofimov_smth2vec.pdf?dl=0 «'''Дистрибутивная гипотеза Харриса, *2vec'''»].
 +
* Доклад [http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group074/Trofimov2015OnlineLearningReinforcementLearning/Trofimov2015OLRL.pdf?format=raw «'''(Глубокое) обучение с подкреплением'''»].
 +
* Доклад [https://www.dropbox.com/s/nnr1d0s0tand0ru/FM_Trofimov.pdf?dl=0 «'''Факторизационные машины'''»].
 +
* Трофимов М. И. «'''Использование нелинейных смесей экспертов в задачах классификации'''» // Сборник тезисов XXII Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2015». Издательский отдел факультета вычислительной математики и кибернетики МГУ имени М. В. Ломоносова, 2015. С. 71-72.
 +
* Трофимов М. И. «'''Факторизационная машина с локальным низким рангом весовой матрицы'''» // Сборник тезисов XXIII Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2016». Издательский отдел факультета вычислительной математики и кибернетики МГУ имени М. В. Ломоносова, 2016. С. 136-138.
 +
* Semenov A., Natekin A., Nikolenko S. I., Upravitelev P., Trofimov M., Kharchenko M. «'''Discerning Depression Propensity Among Participants of Suicide and Depression-Related Groups of Vk.com'''» // Analysis of Images, Social Networks and Texts. 4th International Conference, AIST 2015 // vol 542: Series: Communications in Computer and Information Science. Springer International Publishing, 2015. Ch. 3.
 +
* Ivan Guz, Vasily Leksin, Mikhail Trofimov, Aleksandra Fenster, «'''Evolution of Content Moderation Approaches for Online Classifieds: From Action Recommendations to Automation'''» // ICML'15 Workshop on Crowdsourcing and Machine Learning
 +
* Mansour Ahmadi, Giorgio Giacinto, Dmitry Ulyanov, Stanislav Semenov, Mikhail Trofimov, [http://arxiv.org/abs/1511.04317 «'''Novel feature extraction, selection and fusion for effective malware family classification'''»], ACM Conference on Data and Applications Security and Privacy (CODASPY 2016)
 +
* Новиков, Трофимов, Оселедец, [http://openreview.net/pdf?id=rkYmiD9lg «'''Exponential Machines'''»]
|-
|-
-
|аспиранты 2 г.о.||
+
|аспиранты 3 г.о.||
'''[[Участник:Nizhibitsky|Нижибицкий Евгений]]'''
'''[[Участник:Nizhibitsky|Нижибицкий Евгений]]'''
* Курсовая работа [[Media:NizhibitskyKurs.pdf|«'''Обзор методов классификации документов'''»]].
* Курсовая работа [[Media:NizhibitskyKurs.pdf|«'''Обзор методов классификации документов'''»]].
Строка 270: Строка 189:
* 3-е место в [http://smu.cs.msu.ru/activity/contests/diploma/2014 конкурсе дипломных работ 2014 года].
* 3-е место в [http://smu.cs.msu.ru/activity/contests/diploma/2014 конкурсе дипломных работ 2014 года].
* Нижибицкий Е. А. Трекинг в видеопоследовательностях при помощи фильтра частиц // Сборник тезисов лучших дипломных работ факультета ВМК МГУ 2014 года. Издательский отдел факультета вычислительной математики и кибернетики МГУ имени М. В. Ломоносова, 2014. С. 46-47.
* Нижибицкий Е. А. Трекинг в видеопоследовательностях при помощи фильтра частиц // Сборник тезисов лучших дипломных работ факультета ВМК МГУ 2014 года. Издательский отдел факультета вычислительной математики и кибернетики МГУ имени М. В. Ломоносова, 2014. С. 46-47.
-
* Статья [[Media:NizhibitskyJmlda14.pdf|«'''Композиции признаков для видеотрекинга при помощи фильтра частиц'''»]] (на рецензии в журнале JMLDA).
+
* Нижибицкий Е. А. [http://jmlda.org/papers/doc/2015/no11/Nizhibitsky2015Composition.pdf Композиции признаков для видеотрекинга при помощи фильтра частиц] // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1517 - 1528.
'''[[Участник:MoRandi91|Остапец Андрей]]'''
'''[[Участник:MoRandi91|Остапец Андрей]]'''
Строка 282: Строка 201:
* Остапец А. А. Определение местоположения телефона по данным сенсоров // Машинное обучение и анализ данных. 2014. T. 1, № 9. C. 1232—1245
* Остапец А. А. Определение местоположения телефона по данным сенсоров // Машинное обучение и анализ данных. 2014. T. 1, № 9. C. 1232—1245
* Остапец А. А. Алгебраический подход к задаче иерархической классификации текстов // Сборник тезисов XXII Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2015». Издательский отдел факультета вычислительной математики и кибернетики МГУ имени М. В. Ломоносова, 2015. С. 54-55.
* Остапец А. А. Алгебраический подход к задаче иерархической классификации текстов // Сборник тезисов XXII Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2015». Издательский отдел факультета вычислительной математики и кибернетики МГУ имени М. В. Ломоносова, 2015. С. 54-55.
 +
* Остапец А. А. Определение категории видеозаписи на основе текстовых метаданных // Сборник тезисов XXIII Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2016». Издательский отдел факультета вычислительной математики и кибернетики МГУ имени М. В. Ломоносова, 2016. С. 132-134.
 +
* Остапец А. А. Об одном подходе к решению задачи автоматической классификации товаров на основе текстовой информации // Материалы Международной научной конференции "Современные методы и проблемы теории операторов и гармонического анализа и их приложения - VI", Издательский центр ДГТУ, Ростов, 2016. С. 164-165.
|}
|}

Текущая версия

Руководитель спецсеминара: д.ф.-м.н., профессор Дьяконов Александр Геннадьевич

Направления работы на спецсеминаре

Содержание

В рамках работы на спецсеминаре есть два направления исследования:

  1. Теоретическое. Проводится в рамках алгебраического подхода к решению задач распознавания. Суть подхода: на алгоритмах, которые решают задачи обработки и анализа данных, специальным образом вводятся алгебраические операции. Например, можно складывать алгоритмы (получается опять алгоритм), умножать и т. д. Среди получаемых алгебраических выражений над «естественными» алгоритмами есть высокоэффективные алгоритмы. На спецсеминаре рассматриваются вопросы: как их строить, анализировать, реализовывать на ЭВМ и т. д. и т. п. Здесь же возникают задачи современной теории интерполяции: построения функций специального вида, заданных частично. Можно заниматься дискретным направлением: решать подобные задачи для функций, принимающих значения 0 и 1. Данное направление представляет особую ценность студентам, которые хотят получить самостоятельные результаты в науке и продолжить обучение в аспирантуре.
  2. Прикладное. Решаются реальные прикладные задачи анализа данных (data mining). Например, построение рекомендательных систем, прогнозирование свойств динамических графов (в том числе и графов социальных сетей), прогнозирование поведения потребителей, анализ метаданных, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно).


См. также «Правила для постоянных участников».


Заседания спецсеминара

В осеннем семестре 2019 года заседания будут проходить по понедельникам, начиная с 16 сентября, раз в две недели (через одну), начало в 18:20, ауд. 508. Вход свободный.


Заседания 2019—2020 уч. года

Расписание доступно по ссылке.

Дата Докладчик Доклад Материалы
16 сентября 2019 Иванов Сергей Максимович (617) Метод обратного распространения ошибки

Пытаемся навести порядок в математике, стоящей за концепцией обучения нейросетей.

слайды
16 сентября 2019 Иванов Сергей Максимович (617) Задачи глубинного обучения

Рассматриваем, какие задачи можно решать при помощи методов глубинного обучения.

слайды
30 сентября 2019 Думбай Алексей Дмитриевич (617) Python. Подходы, приемы, интересные факты. слайды
28 октября 2019 Иванов Сергей Максимович (617) Трансформер слайды
28 октября 2019


Заседния в предыдущих семестрах:

Участники прошлых лет

Год выпуска Участники
2018 бак

Иванов Сергей

2017 бак

Никишин Евгений

Каюмов Эмиль

Севастопольский Артём

2018 маг

Викулин Всеволод

Кудрявцев Георгий

  • Курсовая работа «Методы сравнения траекторий».
  • Доклад «Сверточные сети и метод водораздела для семантической сегментации RGBD-видео».
  • Доклад «Закон Бенфорда».

Рысьмятова Анастасия

Вихрева Мария

2017 маг

Кибитова Валерия

Гурьянов Алексей

аспиранты 1 г.о.

Трофимов Михаил


аспиранты 3 г.о.

Нижибицкий Евгений

Остапец Андрей

  • Курсовая работа «Обзор методов линейного регрессионного анализа».
  • Доклад «Deep Learning».
  • Курсовая работа «Применение методов регрессионного анализа для решения задачи прогнозирования временных финансовых рядов».
  • Доклад «Анализ сигналов сенсорных устройств».
  • Остапец А. А. Анализ сигналов сенсорных устройств // Сборник тезисов XXI Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2014». Издательский отдел факультета вычислительной математики и кибернетики МГУ имени М. В. Ломоносова, 2014. С. 41-43.
  • Дипломная работа «Анализ сигналов сенсорных устройств».
  • Остапец А. А. Анализ сигналов сенсорных устройств // Сборник тезисов лучших дипломных работ факультета ВМК МГУ 2014 года. Издательский отдел факультета вычислительной математики и кибернетики МГУ имени М. В. Ломоносова, 2014. С. 44-46.
  • Остапец А. А. Определение местоположения телефона по данным сенсоров // Машинное обучение и анализ данных. 2014. T. 1, № 9. C. 1232—1245
  • Остапец А. А. Алгебраический подход к задаче иерархической классификации текстов // Сборник тезисов XXII Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2015». Издательский отдел факультета вычислительной математики и кибернетики МГУ имени М. В. Ломоносова, 2015. С. 54-55.
  • Остапец А. А. Определение категории видеозаписи на основе текстовых метаданных // Сборник тезисов XXIII Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2016». Издательский отдел факультета вычислительной математики и кибернетики МГУ имени М. В. Ломоносова, 2016. С. 132-134.
  • Остапец А. А. Об одном подходе к решению задачи автоматической классификации товаров на основе текстовой информации // Материалы Международной научной конференции "Современные методы и проблемы теории операторов и гармонического анализа и их приложения - VI", Издательский центр ДГТУ, Ростов, 2016. С. 164-165.

Выпускники спецсеминара

Год выпускаВыпускники
Аспирант, 2010

Карпович Павел

  • Карпович П. А. k-сингулярные системы точек в пространстве l1 // Сборник тезисов XVI Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2009», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2009. — C.34.
  • Карпович П. А. Эффективная реализация алгоритмов распознавания образов // Журнал вычислительной математики и математической физики, 2009, Т. 49, № 8. C.1510-1516.
  • Карпович П. А. О задаче разделения системы точек в пространсте l1 на подсистемы с невырождеными матрицами попарных расстояний // Тезисы конференции МФТИ, Секция проблем интеллектуального анализа данных, распознавания и прогнозирования. — М.: ГОУ ВПО «Московский физико-технический институт (государственный университет)», 2009. — С. 52.
  • Карпович П. А., Дьяконов А. Г. Критерий k-сингулярности систем точек в алгебраическом подходе к распознаванию // 14-я Всероссийская конференция «Математические методы распознавания образов» Владимирская обл., г. Суздаль, 21-26 сентября 2009 г.: Сборник докладов. — М. МАКС Пресс, 2009. С. 41-44.
  • Карпович П.А. Разделение системы точек на подмножества с невырожденными матрицами попарных расстояний // Материалы XVII Международной конференции студентов и аспирантов по фундаментальным наукам «Ломоносов 2010». – М.: Изд. отдел ВМиК МГУ, МАКС Пресс, 2010. – С. 87-88.
  • Карпович П.А. Критерии k-сингулярности и разделение 1-сингулянрных систем // Вестник Московского университета. Секция 15. “Вычислительная математика и кибернетика” – 2010. № 4.
  • Карпович П.А. Дьяконов А.Г. K-сингулярные системы точек, приложения в алгебраическом подходе к распознаванию // Тезисы докладов Международной научной конференции ИОИ-8 Кипр, Пафос - 2010.

Диссертация: «K-сингулярные системы точек в алгебраическом подходе к распознаванию образов» (2010, успешно защищена 18.02.2011 по специальности 01.01.09).

2015 бак

Славнов Константин

2015

Рыжков Александр

Харациди Олег

2014

Нижибицкий Евгений

Остапец Андрей

Фонарев Александр

Ромов Петр Алексеевич

  • раздолбай
2013

Бобрик Ксения

  • Тема работы «Прогнозирование временных рядов».

Ермушева Александра

Кириллов Александр

  • Курсовая работа «Матричное разложение в задаче анализа текстов».
  • Дипломная работа «Дизъюнктивные нормальные формы специального вида для функций с малым количеством нулей».
  • Тема преддипломной практики «Задача оптимизации и моделирования при настройке рекомендательной системы».
  • Второе место на конкурсе Интернет-математика «Relevance Prediction Challenge» (лучший результат среди российских участников).
  • Figurnov M., Kirillov A. Linear combination of random forests for the Relevance Prediction Challenge — 2012.
  • Кириллов А. Н. Предсказание связности графа. // Сборник тезисов XIX Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2012». Секция «Вычислительная математика и кибернетика». М.: МАКС Пресс, 2012, с. 101—102.
  • Кириллов А. Н. Сравнение методов предсказания появления связей в графе. // Сборник докладов 9-й международной конференции «Интеллектуализация обработки информации-2012», М: Торус Пресс, 2012. — С. 629—632.
  • Фигурнов М. В., Кириллов А. Н. Линейная комбинация случайных лесов в задаче предсказания релевантности документов // Сборник докладов 9-й международной конференции «Интеллектуализация обработки информации-2012», М: Торус Пресс, 2012. — С. 648—651.

Кондрашкин Дмитрий (перевёлся на другой спецсеминар)


Фигурнов Михаил

  • Курсовая работа «Метрические критерии k-сингулярности».
  • Дипломная работа «Системы точек с вырожденными матрицами попарных расстояний».
  • Тема преддипломной практики «Технология разработки рекомендательных систем».
  • Второе место на конкурсе Интернет-математика «Relevance Prediction Challenge» (лучший результат среди российских участников).
  • Figurnov M., Kirillov A. Linear combination of random forests for the Relevance Prediction Challenge — 2012.
  • Фигурнов М. В. Линейная комбинация случайных лесов в задаче предсказания релевантности документов. // Сборник тезисов XIX Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2012». Секция «Вычислительная математика и кибернетика». М.: МАКС Пресс, 2012, с. 107—109.
  • Фигурнов М. В., Кириллов А. Н. Линейная комбинация случайных лесов в задаче предсказания релевантности документов // Сборник докладов 9-й международной конференции «Интеллектуализация обработки информации-2012», М: Торус Пресс, 2012. — С. 648—651.
2012

Платонова Елена

2010

Ахламченкова Ольга

  • Дипломная работа «Машинное обучение для ранжирования документов».

Токарева (Одинокова) Евгения

2009

Власова Юлия

  • Дипломная работа «Генерация признаков в задаче классификации сигналов» (PDF, 929 КБ).
  • Власова Ю. В. Применение генетических алгоритмов в задаче классификации сигналов (приложение в BCI) // Сборник тезисов XVI Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2009», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2009. — C.17.
  • Власова Ю. В. Применение генетических алгоритмов в задаче классификации сигналов (приложение в BCI) // Доклады 14-й Всероссийской конференции «Математические методы распознавания образов», М.: МАКС Пресс, 2009, С. 96-99.

Логинов Вячеслав

  • Дипломная работа «Прогнозирование временных рядов с помощью рекуррентных нейросетей с откликом».

Фёдорова Валентина

  • Дипломная работа «Локальные методы прогнозирования временных рядов».
  • Федорова В. П. Локальные методы прогнозирования временных рядов // Сборник тезисов XVI Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2009», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2009. — C.87.

Чучвара Алексндра (бакалавр)

2008

Ломова Дарья

  • Дипломная работа «Выделение закономерностей во временных рядах методом анализа главных компонент».

Вершкова Ирина

  • Дипломная работа «Локальная и глобальная согласованность в интеллектуальном анализе данных».
2007

Кнорре Анна

  • Дипломная работа «Надежность алгоритмов распознавания, основанных на синтезе дизъюнктивных нормальных форм».

Карпович Павел

  • Дипломная работа «Эффективная реализация алгоритмов распознавания образов».

Сиваченко Евгений

  • Дипломная работа «Нейросетевой поиск логических закономерностей».
2006

Ховратович (Курятникова) Татьяна

  • Дипломная работа «Критерии корректности в задачах распознавания образов с малым числом признаков».
  • Курятникова Т. С. Критерии корректности алгебраического и линейного замыкания АВО для малых размерностей // Материалы XII Международной конференции студентов, аспирантов и молодых учёных «Ломоносов», секция «Вычислительная математика и кибернетика». М.: Изд. отд. ВМиК МГУ, 2006. — c. 32-33.

Мошин Николай

  • Дипломная работа «Эффективная реализация алгоритмов решения задачи выполнимости».
2005

Каменева Наталия

  • Дипломная работа «Эффективные логические алгоритмы распознавания, основанные на синтезе ДНФ».

Силкин Леонид

  • Дипломная работа «Оценка разделяющей способности признаков при кодировании информации в задачах распознавания».

Некоторые решаемые прикладные задачи

  • Прогнозирование временных рядов По характеристикам процесса в прошлом предсказать поведение в будущем. Знание о прошлом может быть неполным или ошибочным. Типичный пример: прогнозирование денежных сумм, которые будут сниматься с банкомата в течение следующей недели.
  • Классификация технических сигналов и сигналов головного мозга По описанию изменения некоторой характеристики процесса необходимо определить её класс. Например, по электрокортикограмме определить ментальное состояние человека. При этом обучающая выборка (данные, которые у нас есть) была собрана достаточно давно, а тестирование алгоритма будет проводиться потом (при изменённых внешних условиях, а следовательно, при изменённых характеристиках данных).
  • Фильтрация спама Настроить спам-фильтр на некотором универсальном обучающем множестве (данных спам-ловушек) так, чтобы он хорошо работал на компьютере конкретного пользователя (без дополнительной донастройки).
  • Иерархическая классификация текстов Написать алгоритм автоматической категоризации документов. Например, новостные рассылки необходимо распределить по каталогам «спорт/футбол», «спорт/биатлон», «музыка/концерты», «музыка/рок/исполнители» и т. д.
  • Ранжирование документов на основе обучающего множества Написать алгоритм, который оценивает релевантность документа поисковому запросу. Для фиксированного запроса упорядочить документы (используя их признаковые описания) так, чтобы порядок отражал «адекватность» запроса.
  • Прогноз связности графа социальной сети Предсказать изменения динамического графа социальной сети, в частности, появление новых рёбер.
  • Прогнозирование успешности грантов и проектов По описанию заявки оценить перспективность выполнения данного проекта.
  • Разработка рекомендательного алгоритма, который делает актуальные предложения купить какой-то товар, воспользоваться услугой или прочитать материал.
  • Предсказывание визитов покупателей и сумм покупок для сети супермаркетов Разработка алгоритма, который предсказывает дату первого визита и сумму покупки каждого клиента.
  • Оценка фотографий по метаданным Прогноз «интересности» фото-материалов на основе анализа названия, описания, GPS-координат съёмки и т.п.
  • Задача кредитного скоринга Прогнозирование надёжности клиента банка по обязательствам выплаты процентов кредита.