Материал из MachineLearning.
Руководитель спецсеминара: к.ф.-м.н. Дьяконов Александр Геннадьевич
Работа на спецсеминаре
Работа на спецсеминаре состоит из двух направлений:
- Теоретическое. Проводится в рамках алгебраического подхода к решению задач распознавания. Суть подхода: на алгоритмах, которые решают задачи обработки и анализа данных, специальным образом вводятся алгебраические операции. Например, можно складывать алгоритмы (получается опять алгоритм), умножать и т.д. Доказано (Ю.И. Журавлёвым), что среди получаемых алгебраических выражений над «естественными» алгоритмами есть высокоэффективные алгоритмы. На спецсеминаре рассматриваются вопросы: как их строить, анализировать, реализовывать на ЭВМ и т.д. и т.п. Данное направление представляет особую ценность студентам, которые хотят получить самостоятельные результаты в науке и продолжить обучение в аспирантуре.
- Прикладное. Решаются реальные прикладные задачи анализа данных (data mining). Например, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно).
Участники спецсеминара
Год выпуска | Участники
|
Аспирант, 2010 |
Карпович Павел
- Карпович П.А. k-сингулярные системы точек в пространстве l1 // Сборник тезисов XVI Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2009», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2009. - C.34.
- Карпович П.А. Эффективная реализация алгоритмов распознавания образов // Журнал вычислительной математики и математической физики, 2009, Т. 49, №8. C.1510–1516
- Карпович П.А. О задаче разделения системы точек в пространсте l1 на подсистемы с невырождеными матрицами попарных расстояний // Тезисы конференции МФТИ, Секция проблем интеллектуального анализа данных, распознавания и прогнозирования. - М.: ГОУ ВПО «Московский физико-технический институт (государственный университет)», 2009. - С. 52.
- Карпович П.А., Дьяконов А.Г. Критерий k-сингулярности систем точек в алгебраическом подходе к распознаванию // 14-я Всероссийская конференция «Математические методы распознавания образов» Владимирская обл., г. Суздаль, 21-26 сентября 2009 г.: Сборник докладов. – М. МАКС Пресс, 2009. С. 41-44.
|
2012 |
Платонова Елена
- Семестровая работа (5 семестр) «Муравьиные алгоритмы»
|
2010 |
Ахламченкова Ольга
- Дипломная работа «Машинное обучение для ранжирования документов»
Одинокова Евгения
- Дипломная работа «Методы иерархической классификации текстов»
|
2009 |
Власова Юлия
- Дипломная работа «Генерация признаков в задаче классификации сигналов» (PDF, 929 КБ).
- Власова Ю.В. Применение генетических алгоритмов в задаче классификации сигналов (приложение в BCI) // Сборник тезисов XVI Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2009», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2009. - C.17.
- Власова Ю.В. Применение генетических алгоритмов в задаче классификации сигналов (приложение в BCI) // Доклады 14-й Всероссийской конференции "Математические методы распознавания образов", М.: МАКС Пресс, 2009, С. 96-99.
Логинов Вячеслав
- Дипломная работа «Прогнозирование временных рядов с помощью рекуррентных нейросетей с откликом»
Фёдорова Валентина
- Дипломная работа «Локальные методы прогнозирования временных рядов»
- Федорова В.П. Локальные методы прогнозирования временных рядов // Сборник тезисов XVI Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2009», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2009. - C.87.
Чучвара Алексндра (бакалавр)
- Квалификационная работа «Частичное машинное обучение в задачах классификации текстов»
|
2008 |
Ломова Дарья
- Дипломная работа «Выделение закономерностей во временных рядах методом анализа главных компонент»
Вершкова Ирина
- Дипломная работа «Локальная и глобальная согласованность в интеллектуальном анализе данных»
|
2007 |
Кнорре Анна
- Дипломная работа «Надежность алгоритмов распознавания, основанных на синтезе дизъюнктивных нормальных форм»
Карпович Павел
- Дипломная работа «Эффективная реализация алгоритмов распознавания образов»
Сиваченко Евгений
- Дипломная работа «Нейросетевой поиск логических закономерностей»
|
2006 |
Ховратович (Курятникова) Татьяна
- Дипломная работа «Критерии корректности в задачах распознавания образов с малым числом признаков»
- Курятникова Т.С. Критперии корректности алгебраического и линейного замыкания АВО для малых размерностей // Материалы XII Международной конференции студентов, аспирантов и молодых учёных "Ломносов", секция "Вычислительная математика и кибернетика". М.: Изд. отд. ВМиК МГУ, 2006. - c. 32-33.
Мошин Николай
- Дипломная работа «Эффективная реализация алгоритмов решения задачи выполнимости».
|
2005 |
Каменева Наталья
- Дипломная работа «Эффективные логические алгоритмы распознавания, основанные на синтезе ДНФ»
Силкин Леонид
- Дипломная работа «Оценка разделяющей способности признаков при кодировании информации в задачах распознавания»
|
Решаемые прикладные задачи
- Прогнозирование временных рядов По характеристикам процесса в прошлом предсказать поведение в будущем. Знание о прошлом может быть неполным или ошибочным. Типичный пример: прогнозирование сумм, которые будут сниматься с банкомата в течение следующей недели.
- Классификация технических сигналов и сигналов головного мозга По описанию изменения некоторой характеристики процесса необходимо определить её класс. Например, по электрокортикограмме определить ментальное состояние человека. При этом обучающая выборка (данные, которые у нас есть) была собрана достаточно давно, а тестирование алгоритма будет проводиться потом (при изменённых внешних условвиях, а следовательно, при изменённых характеристиках данных).
- Фильтрация спама Настроить спам фильтр на некотором универсальном обучающем множестве (данных спам-ловушек) так, чтобы он хорошо работал на компьютере конкретного пользователя (без дополнительной донастройки).
- Иерархическая классификация текстов Написать алгоритм автоматической категоризации документов - . Например, новостные рассылки необходимо распределять по каталогам "спорт/футбол", "спорт/биатлон", "музыка/концерты", "музыка/рок/исполнители".
- Ранжирование документов на основе обучающего множества Написать алгоритм, который оценивает релевантность документа поисковому запросу. Для фиксированного запроса упорядочить документы (используя их признаковые описания) так, чтобы прядок отражал "адекватность" запросу.