Алгебра над алгоритмами и эвристический поиск закономерностей
Материал из MachineLearning.
(Различия между версиями)
(→Решаемые прикладные задачи) |
(→Решаемые прикладные задачи) |
||
Строка 74: | Строка 74: | ||
* [http://www.neural-forecasting-competition.com/ Прогнозирование временных рядов] По характеристикам процесса в прошлом предсказать поведение в будущем. Знание о прошлом может быть неполным или ошибочным. Типичный пример: прогнозирование денежных сумм, которые будут сниматься с банкомата в течение следующей недели. | * [http://www.neural-forecasting-competition.com/ Прогнозирование временных рядов] По характеристикам процесса в прошлом предсказать поведение в будущем. Знание о прошлом может быть неполным или ошибочным. Типичный пример: прогнозирование денежных сумм, которые будут сниматься с банкомата в течение следующей недели. | ||
* Классификация [http://home.comcast.net/~nn_classification/ технических сигналов] и [http://www.bbci.de/competition сигналов головного мозга] По описанию изменения некоторой характеристики процесса необходимо определить её класс. Например, по электрокортикограмме определить ментальное состояние человека. При этом обучающая выборка (данные, которые у нас есть) была собрана достаточно давно, а тестирование алгоритма будет проводиться потом (при изменённых внешних условвиях, а следовательно, при изменённых характеристиках данных). | * Классификация [http://home.comcast.net/~nn_classification/ технических сигналов] и [http://www.bbci.de/competition сигналов головного мозга] По описанию изменения некоторой характеристики процесса необходимо определить её класс. Например, по электрокортикограмме определить ментальное состояние человека. При этом обучающая выборка (данные, которые у нас есть) была собрана достаточно давно, а тестирование алгоритма будет проводиться потом (при изменённых внешних условвиях, а следовательно, при изменённых характеристиках данных). | ||
- | * [http://www.ecmlpkdd2006.org/challenge.html Фильтрация спама] Настроить спам фильтр на некотором универсальном обучающем множестве (данных спам-ловушек) так, чтобы он хорошо работал на компьютере конкретного пользователя (без дополнительной донастройки). | + | * [http://www.ecmlpkdd2006.org/challenge.html Фильтрация спама] Настроить спам-фильтр на некотором универсальном обучающем множестве (данных спам-ловушек) так, чтобы он хорошо работал на компьютере конкретного пользователя (без дополнительной донастройки). |
* [http://lshtc.iit.demokritos.gr/ Иерархическая классификация текстов] Написать алгоритм автоматической категоризации документов - . Например, новостные рассылки необходимо распределять по каталогам "спорт/футбол", "спорт/биатлон", "музыка/концерты", "музыка/рок/исполнители". | * [http://lshtc.iit.demokritos.gr/ Иерархическая классификация текстов] Написать алгоритм автоматической категоризации документов - . Например, новостные рассылки необходимо распределять по каталогам "спорт/футбол", "спорт/биатлон", "музыка/концерты", "музыка/рок/исполнители". | ||
* [http://imat2009.yandex.ru/ Ранжирование документов на основе обучающего множества] Написать алгоритм, который оценивает релевантность документа поисковому запросу. Для фиксированного запроса упорядочить документы (используя их признаковые описания) так, чтобы прядок отражал "адекватность" запросу. | * [http://imat2009.yandex.ru/ Ранжирование документов на основе обучающего множества] Написать алгоритм, который оценивает релевантность документа поисковому запросу. Для фиксированного запроса упорядочить документы (используя их признаковые описания) так, чтобы прядок отражал "адекватность" запросу. | ||
[[Категория:Учебные курсы]] | [[Категория:Учебные курсы]] |
Версия 11:21, 14 января 2010
Руководитель спецсеминара: к.ф.-м.н. Дьяконов Александр Геннадьевич
|
Работа на спецсеминаре
Работа на спецсеминаре состоит из двух направлений:
- Теоретическое. Проводится в рамках алгебраического подхода к решению задач распознавания. Суть подхода: на алгоритмах, которые решают задачи обработки и анализа данных, специальным образом вводятся алгебраические операции. Например, можно складывать алгоритмы (получается опять алгоритм), умножать и т.д. Доказано (Ю.И. Журавлёвым), что среди получаемых алгебраических выражений над «естественными» алгоритмами есть высокоэффективные алгоритмы. На спецсеминаре рассматриваются вопросы: как их строить, анализировать, реализовывать на ЭВМ и т.д. и т.п. Данное направление представляет особую ценность студентам, которые хотят получить самостоятельные результаты в науке и продолжить обучение в аспирантуре.
- Прикладное. Решаются реальные прикладные задачи анализа данных (data mining). Например, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно).
Участники спецсеминара
Год выпуска | Участники |
---|---|
Аспирант, 2010 |
Карпович Павел
|
2012 |
|
2010 |
Ахламченкова Ольга
Одинокова Евгения
|
2009 |
Власова Юлия
Логинов Вячеслав
Фёдорова Валентина
Чучвара Алексндра (бакалавр)
|
2008 |
Ломова Дарья
Вершкова Ирина
|
2007 |
Кнорре Анна
Карпович Павел
Сиваченко Евгений
|
2006 |
Ховратович (Курятникова) Татьяна
Мошин Николай
|
2005 |
Каменева Наталья
Силкин Леонид
|
Решаемые прикладные задачи
- Прогнозирование временных рядов По характеристикам процесса в прошлом предсказать поведение в будущем. Знание о прошлом может быть неполным или ошибочным. Типичный пример: прогнозирование денежных сумм, которые будут сниматься с банкомата в течение следующей недели.
- Классификация технических сигналов и сигналов головного мозга По описанию изменения некоторой характеристики процесса необходимо определить её класс. Например, по электрокортикограмме определить ментальное состояние человека. При этом обучающая выборка (данные, которые у нас есть) была собрана достаточно давно, а тестирование алгоритма будет проводиться потом (при изменённых внешних условвиях, а следовательно, при изменённых характеристиках данных).
- Фильтрация спама Настроить спам-фильтр на некотором универсальном обучающем множестве (данных спам-ловушек) так, чтобы он хорошо работал на компьютере конкретного пользователя (без дополнительной донастройки).
- Иерархическая классификация текстов Написать алгоритм автоматической категоризации документов - . Например, новостные рассылки необходимо распределять по каталогам "спорт/футбол", "спорт/биатлон", "музыка/концерты", "музыка/рок/исполнители".
- Ранжирование документов на основе обучающего множества Написать алгоритм, который оценивает релевантность документа поисковому запросу. Для фиксированного запроса упорядочить документы (используя их признаковые описания) так, чтобы прядок отражал "адекватность" запросу.