Алгебра над алгоритмами и эвристический поиск закономерностей

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Решаемые прикладные задачи)
(Решаемые прикладные задачи)
Строка 75: Строка 75:
* Классификация [http://home.comcast.net/~nn_classification/ технических сигналов] и [http://www.bbci.de/competition сигналов головного мозга] По описанию изменения некоторой характеристики процесса необходимо определить её класс. Например, по электрокортикограмме определить ментальное состояние человека. При этом обучающая выборка (данные, которые у нас есть) была собрана достаточно давно, а тестирование алгоритма будет проводиться потом (при изменённых внешних условвиях, а следовательно, при изменённых характеристиках данных).
* Классификация [http://home.comcast.net/~nn_classification/ технических сигналов] и [http://www.bbci.de/competition сигналов головного мозга] По описанию изменения некоторой характеристики процесса необходимо определить её класс. Например, по электрокортикограмме определить ментальное состояние человека. При этом обучающая выборка (данные, которые у нас есть) была собрана достаточно давно, а тестирование алгоритма будет проводиться потом (при изменённых внешних условвиях, а следовательно, при изменённых характеристиках данных).
* [http://www.ecmlpkdd2006.org/challenge.html Фильтрация спама] Настроить спам-фильтр на некотором универсальном обучающем множестве (данных спам-ловушек) так, чтобы он хорошо работал на компьютере конкретного пользователя (без дополнительной донастройки).
* [http://www.ecmlpkdd2006.org/challenge.html Фильтрация спама] Настроить спам-фильтр на некотором универсальном обучающем множестве (данных спам-ловушек) так, чтобы он хорошо работал на компьютере конкретного пользователя (без дополнительной донастройки).
-
* [http://lshtc.iit.demokritos.gr/ Иерархическая классификация текстов] Написать алгоритм автоматической категоризации документов - . Например, новостные рассылки необходимо распределять по каталогам "спорт/футбол", "спорт/биатлон", "музыка/концерты", "музыка/рок/исполнители".
+
* [http://lshtc.iit.demokritos.gr/ Иерархическая классификация текстов] Написать алгоритм автоматической категоризации документов. Например, новостные рассылки необходимо распределять по каталогам "спорт/футбол", "спорт/биатлон", "музыка/концерты", "музыка/рок/исполнители".
* [http://imat2009.yandex.ru/ Ранжирование документов на основе обучающего множества] Написать алгоритм, который оценивает релевантность документа поисковому запросу. Для фиксированного запроса упорядочить документы (используя их признаковые описания) так, чтобы прядок отражал "адекватность" запросу.
* [http://imat2009.yandex.ru/ Ранжирование документов на основе обучающего множества] Написать алгоритм, который оценивает релевантность документа поисковому запросу. Для фиксированного запроса упорядочить документы (используя их признаковые описания) так, чтобы прядок отражал "адекватность" запросу.
[[Категория:Учебные курсы]]
[[Категория:Учебные курсы]]

Версия 11:22, 14 января 2010

Руководитель спецсеминара: к.ф.-м.н. Дьяконов Александр Геннадьевич

Содержание

Работа на спецсеминаре

Работа на спецсеминаре состоит из двух направлений:

  1. Теоретическое. Проводится в рамках алгебраического подхода к решению задач распознавания. Суть подхода: на алгоритмах, которые решают задачи обработки и анализа данных, специальным образом вводятся алгебраические операции. Например, можно складывать алгоритмы (получается опять алгоритм), умножать и т.д. Доказано (Ю.И. Журавлёвым), что среди получаемых алгебраических выражений над «естественными» алгоритмами есть высокоэффективные алгоритмы. На спецсеминаре рассматриваются вопросы: как их строить, анализировать, реализовывать на ЭВМ и т.д. и т.п. Данное направление представляет особую ценность студентам, которые хотят получить самостоятельные результаты в науке и продолжить обучение в аспирантуре.
  2. Прикладное. Решаются реальные прикладные задачи анализа данных (data mining). Например, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно).

Участники спецсеминара

Год выпускаУчастники
Аспирант, 2010

Карпович Павел

  • Карпович П.А. k-сингулярные системы точек в пространстве l1 // Сборник тезисов XVI Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2009», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2009. - C.34.
  • Карпович П.А. Эффективная реализация алгоритмов распознавания образов // Журнал вычислительной математики и математической физики, 2009, Т. 49, №8. C.1510–1516
  • Карпович П.А. О задаче разделения системы точек в пространсте l1 на подсистемы с невырождеными матрицами попарных расстояний // Тезисы конференции МФТИ, Секция проблем интеллектуального анализа данных, распознавания и прогнозирования. - М.: ГОУ ВПО «Московский физико-технический институт (государственный университет)», 2009. - С. 52.
  • Карпович П.А., Дьяконов А.Г. Критерий k-сингулярности систем точек в алгебраическом подходе к распознаванию // 14-я Всероссийская конференция «Математические методы распознавания образов» Владимирская обл., г. Суздаль, 21-26 сентября 2009 г.: Сборник докладов. – М. МАКС Пресс, 2009. С. 41-44.
2012

Платонова Елена

  • Семестровая работа (5 семестр) «Муравьиные алгоритмы»
2010

Ахламченкова Ольга

  • Дипломная работа «Машинное обучение для ранжирования документов»

Одинокова Евгения

  • Дипломная работа «Методы иерархической классификации текстов»
2009

Власова Юлия

  • Дипломная работа «Генерация признаков в задаче классификации сигналов» (PDF, 929 КБ).
  • Власова Ю.В. Применение генетических алгоритмов в задаче классификации сигналов (приложение в BCI) // Сборник тезисов XVI Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2009», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2009. - C.17.
  • Власова Ю.В. Применение генетических алгоритмов в задаче классификации сигналов (приложение в BCI) // Доклады 14-й Всероссийской конференции "Математические методы распознавания образов", М.: МАКС Пресс, 2009, С. 96-99.

Логинов Вячеслав

  • Дипломная работа «Прогнозирование временных рядов с помощью рекуррентных нейросетей с откликом»

Фёдорова Валентина

  • Дипломная работа «Локальные методы прогнозирования временных рядов»
  • Федорова В.П. Локальные методы прогнозирования временных рядов // Сборник тезисов XVI Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2009», секция «Вычислительная математика и кибернетика», М: МАКС Пресс, 2009. - C.87.

Чучвара Алексндра (бакалавр)

  • Квалификационная работа «Частичное машинное обучение в задачах классификации текстов»
2008

Ломова Дарья

  • Дипломная работа «Выделение закономерностей во временных рядах методом анализа главных компонент»

Вершкова Ирина

  • Дипломная работа «Локальная и глобальная согласованность в интеллектуальном анализе данных»
2007

Кнорре Анна

  • Дипломная работа «Надежность алгоритмов распознавания, основанных на синтезе дизъюнктивных нормальных форм»

Карпович Павел

  • Дипломная работа «Эффективная реализация алгоритмов распознавания образов»

Сиваченко Евгений

  • Дипломная работа «Нейросетевой поиск логических закономерностей»
2006

Ховратович (Курятникова) Татьяна

  • Дипломная работа «Критерии корректности в задачах распознавания образов с малым числом признаков»
  • Курятникова Т.С. Критперии корректности алгебраического и линейного замыкания АВО для малых размерностей // Материалы XII Международной конференции студентов, аспирантов и молодых учёных "Ломносов", секция "Вычислительная математика и кибернетика". М.: Изд. отд. ВМиК МГУ, 2006. - c. 32-33.

Мошин Николай

  • Дипломная работа «Эффективная реализация алгоритмов решения задачи выполнимости».
2005

Каменева Наталья

  • Дипломная работа «Эффективные логические алгоритмы распознавания, основанные на синтезе ДНФ»

Силкин Леонид

  • Дипломная работа «Оценка разделяющей способности признаков при кодировании информации в задачах распознавания»

Решаемые прикладные задачи

  • Прогнозирование временных рядов По характеристикам процесса в прошлом предсказать поведение в будущем. Знание о прошлом может быть неполным или ошибочным. Типичный пример: прогнозирование денежных сумм, которые будут сниматься с банкомата в течение следующей недели.
  • Классификация технических сигналов и сигналов головного мозга По описанию изменения некоторой характеристики процесса необходимо определить её класс. Например, по электрокортикограмме определить ментальное состояние человека. При этом обучающая выборка (данные, которые у нас есть) была собрана достаточно давно, а тестирование алгоритма будет проводиться потом (при изменённых внешних условвиях, а следовательно, при изменённых характеристиках данных).
  • Фильтрация спама Настроить спам-фильтр на некотором универсальном обучающем множестве (данных спам-ловушек) так, чтобы он хорошо работал на компьютере конкретного пользователя (без дополнительной донастройки).
  • Иерархическая классификация текстов Написать алгоритм автоматической категоризации документов. Например, новостные рассылки необходимо распределять по каталогам "спорт/футбол", "спорт/биатлон", "музыка/концерты", "музыка/рок/исполнители".
  • Ранжирование документов на основе обучающего множества Написать алгоритм, который оценивает релевантность документа поисковому запросу. Для фиксированного запроса упорядочить документы (используя их признаковые описания) так, чтобы прядок отражал "адекватность" запросу.
Личные инструменты