Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 074, осень 2013
Материал из MachineLearning.
(Различия между версиями)
(→Черновой список задач) |
|||
Строка 2: | Строка 2: | ||
__NOTOC__ | __NOTOC__ | ||
+ | == Задачи == | ||
+ | {|class="wikitable" | ||
+ | |- | ||
+ | ! Название задачи | ||
+ | ! Автор | ||
+ | ! Ссылка | ||
+ | !MAIPVTDCHSJ | ||
+ | |- | ||
+ | |Определение напечатанного изображения (пример) | ||
+ | |Пушняков Алексей (пример) | ||
+ | |[http://svn.code.sf.net/p/mlalgorithms/code/Pushnyakov2013SpectrumImage/doc/Pushnyakov2013SpectrumImage.pdf] | ||
+ | |MAIPVTDCHSJ | ||
+ | |- | ||
+ | |Welcome! | ||
+ | | | ||
+ | | | ||
+ | | | ||
+ | |- | ||
+ | |} | ||
- | |||
+ | |||
+ | == Расписание == | ||
+ | {|class="wikitable" | ||
+ | ! Дата | ||
+ | ! | ||
+ | ! Что делаем | ||
+ | ! Результат для обсуждения | ||
+ | ! Код | ||
+ | |- | ||
+ | |Март | ||
+ | |7 | ||
+ | |Выбрана задача, рецензент. | ||
+ | |Запись в ML. | ||
+ | | | ||
+ | |- | ||
+ | |||
+ | |||
+ | == Расписание == | ||
+ | {|class="wikitable" | ||
+ | ! Дата | ||
+ | ! | ||
+ | ! Что делаем | ||
+ | ! Результат для обсуждения | ||
+ | ! Код | ||
+ | |- | ||
+ | |Сентябрь | ||
+ | |17 | ||
+ | |Выбрана задача, рецензент. | ||
+ | |Запись в ML. | ||
+ | |Problem | ||
+ | |- | ||
+ | | | ||
+ | |25 | ||
+ | |Собрана литература, написаны комментарии. | ||
+ | |Список литературы и мини-сообщение. | ||
+ | |Literatura | ||
+ | |- | ||
+ | |2 | ||
+ | |Октябрь | ||
+ | |Поставлена задача для синтетических данных. Написана математическая постановка в формате TeX. | ||
+ | |Не более страницы отдельного текста. | ||
+ | |Statement | ||
+ | |- | ||
+ | |9 | ||
+ | | | ||
+ | |Создан файл отчета. Сделано описание проекта. Создана архитектура и интерфейс ядра системы (синтетические данные). | ||
+ | |Описание, IDEF0. | ||
+ | |ideF | ||
+ | |- | ||
+ | |16 | ||
+ | | | ||
+ | |Детализирован интерфейс, написан код первого приближения. | ||
+ | |Код для синтетических данных. | ||
+ | |Code | ||
+ | |- | ||
+ | | | ||
+ | |23 | ||
+ | |Написаны юнит-тесты. По результатам доработки кода написана рецензия на работу. | ||
+ | |Тесты, рецензия | ||
+ | |Unit-test | ||
+ | |- | ||
+ | | | ||
+ | |30 | ||
+ | |Собраны реальные данные. Доработана схема IDEF0. Написаны модули подготовки данных. | ||
+ | |Данные, вторая схема IDEF0, модули. | ||
+ | |Data | ||
+ | |- | ||
+ | |6 | ||
+ | |Ноябрь | ||
+ | |Собраны реальные данные. Доработана схема IDEF0. Написаны модули подготовки данных. | ||
+ | |Данные, вторая схема IDEF0, модули. | ||
+ | |Data | ||
+ | |- | ||
+ | |13 | ||
+ | | | ||
+ | |Написаны и запущены системные тесты. | ||
+ | |Тесты и отчет. | ||
+ | |Tests | ||
+ | |- | ||
+ | |20 | ||
+ | | | ||
+ | |Код оптимизирован. | ||
+ | |Отчет профайлера до и после. | ||
+ | |Profiler | ||
+ | |- | ||
+ | |27 | ||
+ | | | ||
+ | |Написаны и запущены системные тесты. | ||
+ | |Тесты и отчет. | ||
+ | |Tests | ||
+ | |- | ||
+ | |4 | ||
+ | |Декабрь | ||
+ | |Написаны и запущены системные тесты. | ||
+ | |Тесты и отчет. | ||
+ | |Tests | ||
+ | |||
+ | |- | ||
+ | |} | ||
+ | |||
+ | |||
+ | |||
+ | == Черновой список задач == | ||
=== Выбор алгоритмов краткосрочного прогнозирования === | === Выбор алгоритмов краткосрочного прогнозирования === | ||
* '''Краткое описание.''' Создать алгоритм, осуществляющий выбор моделей прогнозирования на основе метаописания временных рядов. | * '''Краткое описание.''' Создать алгоритм, осуществляющий выбор моделей прогнозирования на основе метаописания временных рядов. |
Версия 20:16, 10 сентября 2013
Задачи
Название задачи | Автор | Ссылка | MAIPVTDCHSJ |
---|---|---|---|
Определение напечатанного изображения (пример) | Пушняков Алексей (пример) | [1] | MAIPVTDCHSJ |
Welcome! |
Расписание
Дата | Что делаем | Результат для обсуждения | Код | |
---|---|---|---|---|
Март | 7 | Выбрана задача, рецензент. | Запись в ML. |
Дата | Что делаем | Результат для обсуждения | Код | |
---|---|---|---|---|
Сентябрь | 17 | Выбрана задача, рецензент. | Запись в ML. | Problem |
25 | Собрана литература, написаны комментарии. | Список литературы и мини-сообщение. | Literatura | |
2 | Октябрь | Поставлена задача для синтетических данных. Написана математическая постановка в формате TeX. | Не более страницы отдельного текста. | Statement |
9 | Создан файл отчета. Сделано описание проекта. Создана архитектура и интерфейс ядра системы (синтетические данные). | Описание, IDEF0. | ideF | |
16 | Детализирован интерфейс, написан код первого приближения. | Код для синтетических данных. | Code | |
23 | Написаны юнит-тесты. По результатам доработки кода написана рецензия на работу. | Тесты, рецензия | Unit-test | |
30 | Собраны реальные данные. Доработана схема IDEF0. Написаны модули подготовки данных. | Данные, вторая схема IDEF0, модули. | Data | |
6 | Ноябрь | Собраны реальные данные. Доработана схема IDEF0. Написаны модули подготовки данных. | Данные, вторая схема IDEF0, модули. | Data |
13 | Написаны и запущены системные тесты. | Тесты и отчет. | Tests | |
20 | Код оптимизирован. | Отчет профайлера до и после. | Profiler | |
27 | Написаны и запущены системные тесты. | Тесты и отчет. | Tests | |
4 | Декабрь | Написаны и запущены системные тесты. | Тесты и отчет. | Tests |
Черновой список задач
Выбор алгоритмов краткосрочного прогнозирования
- Краткое описание. Создать алгоритм, осуществляющий выбор моделей прогнозирования на основе метаописания временных рядов.
- Базовый алгоритм. Базовые модели для выбора: проект TSForecasting. Простейший метод для выбора моделей — дерево поиска. Метаописание временных рядов: А. И. Кобзарь Прикладная математическая статистика.
- Данные. Цены на электроэнергию, биржевые данные, цены на хлеб.
- Аргументы.
Прогнозирование цен на электроэнергию
- Краткое описание. Построить авторегрессионный алгоритм прогнозирования; осуществить выбор признаков методом наименьших углов.
- Базовый алгоритм. Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования временных рядов. LARS.
- Данные. Цены на электроэнергию.
- Аргументы.
Распознавание геометрических фигур на фото
Поиск мелодии в базе данных
- Краткое описание. Задана библиотека мелодий. Для короткого музыкального фрагмента требуется определить, какой мелодии он принадлежит.
- Базовый алгоритм. Локальное прогнозирование.
- Данные. Библиотека мелодий в формате .midi. matlab .midi parser
- Аргументы.
Краткосрочное прогнозирование музыкальных произведений
- Краткое описание. Спрогнозировать простейшее музыкальное произведение функциями дискретного аргумента по предыстории.
- Базовый алгоритм. Прогнозирование функциями дискретного аргумента
- Данные. Библиотека мелодий в формате .midi. matlab .midi parser
- Аргументы.
Проверка подлинности подписей
Поиск похожих тезисов конференций
- Краткое описание. Найти тезисы конференции OR-2013, близкие к заданному.
- Базовый алгоритм. https://svn.code.sf.net/p/mlalgorithms/code/KuzminAduenkoStrijov2012ThematicClustering/
- Данные. Библиотека тезисов конференции OR-2013.
- Аргументы.
Сегментация библиографических списков
- Краткое описание. Разработать алгоритм сегментации библиографической записи.
- Базовый алгоритм. Скрытая марковская модель на основе мягкой кластеризации с учетом регулярных выражений.
- Данные. База данных библиографических списков (возможно, придется дополнить).
- Аргументы.
Распознавание рукописных цифр
- Краткое описание. Classify handwritten digits using the famous MNIST data.
- Базовый алгоритм. Convolutional Neural Networks
- Данные. http://www.kaggle.com/c/digit-recognizer/data
- Аргументы.
Ранжирование поисковой выдачи
- Краткое описание. Интернет-математика 2009.
- Базовый алгоритм.
- Данные. http://imat2009.yandex.ru/academic/mathematic/2009/datasets
- Аргументы.
Определение наличия и характеристик пульсовой волны
Построение рейтинга научных журналов
- Краткое описание. Построение совместного рейтинга научных журналов и публикующихся в них авторов.
- Базовый алгоритм. Co-clusterization
- Данные. Данные журнал-автор.
- Аргументы.
Визуализация подписей-выносок
- Краткое описание. Разработать метод оптимального расположения подписей-выносок.
- Базовый алгоритм. http://strijov.com/papers/AduenkoStrijov2013TextVisualizing.pdf
- Данные.
- Аргументы.
Прогнозирование редких продаж по набору временных рядов
Определение финансовых пузырей в биржевых данных
- Краткое описание. Разработать метод определения финансовых пузырей в биржевых данных по ценам на сырье.
- Базовый алгоритм. статья Вилли.
- Данные. Цены на сырье.
- Аргументы.
Исследование изменения влияния макроэкономических показателей
- Краткое описание. Требуется построить модель влияния экономических показателей на ВВП и оценить изменения влияния каждого показателя с течением времени.
- Базовый алгоритм. Flexible least squares
- Данные. Данные макроэкономических показателей
- Аргументы.
Прогнозирование концентрации кислорода в выхлопных газах дизельного двигателя
Обнаружение причинно-следственных связей во временных рядах железнодорожных перевозок и биржевых данных
- Краткое описание. Разработать алгоритм, детектирующий влияние экзогенных факторов на железнодорожные перевозки.
- Базовый алгоритм. Convergent cross mapping.
- Данные. Данные РЖД по железнодорожным перевозкам.
- Аргументы.
Распознавание лиц
- Краткое описание. Facial Keypoints Detection.
- Базовый алгоритм. Pictorial structures
- Данные. http://www.kaggle.com/c/facial-keypoints-detection/data
- Аргументы.
Personalize Expedia Hotel Searches
- Краткое описание. ICDM 2013
- Базовый алгоритм.
- Данные. http://www.kaggle.com/c/expedia-personalized-sort/data
- Аргументы.
Определение нежелательных SMS-сообщений
- Краткое описание. Фильтрация спам SMS рассылок посредством
- Базовый алгоритм.
- Данные. http://www.dt.fee.unicamp.br/~tiago/smsspamcollection/
- Аргументы.
Кластеризация треков по типу активности
- Краткое описание. Необходимо кластеризовать треки ежедневного человеческого быта по типу активности (например, спорт, шоппинг, дорога домой)
- Базовый алгоритм.
- Данные. http://research.microsoft.com/en-us/downloads/b16d359d-d164-469e-9fd4-daa38f2b2e13/default.aspx
- Аргументы.
Определение типа активности человека по данным с акселерометра
- Краткое описание. Определение типа локальной активности (пеший ход, бег, подъем по лестнице и др.) по данным с акселерометра на теле человека.
- Базовый алгоритм.
- Данные.
- Аргументы.
Классификация сердцебиений
- Краткое описание. Первичная сегментация кардиограммы. Классификация типов сердцебиений.
- Базовый алгоритм.
- Данные. http://www.peterjbentley.com/heartchallenge/#dates
- Аргументы.
Фильтрация вредоносных URL, по названию ресурса
- Краткое описание. Фильтрация вредоносных URL, по названию ресурса (например фишинговые ссылки)
- Базовый алгоритм.
- Данные. http://sysnet.ucsd.edu/projects/url/
- Аргументы.
Задача навигации робота
- Краткое описание. Робот вдоль стены, считывает показания с датчиков, и принимает решения о изменении траектории (поворот на 30, 60 и 90 градусов)
- Базовый алгоритм.
- Данные. http://archive.ics.uci.edu/ml/datasets/Wall-Following+Robot+Navigation+Data
- Аргументы.
Распознавания текста на фотографиях
- Краткое описание. Локализация и распознавание текста на снимках Google Street View.
- Базовый алгоритм. http://cmp.felk.cvut.cz/~neumalu1/neumann-cvpr2012.pdf
- Данные.
- Аргументы.
Прогноз лесных пожаров
- Краткое описание. Прогнозирование распространения лесных пожаров по метеорологическим данным.
- Базовый алгоритм.
- Данные. http://archive.ics.uci.edu/ml/datasets/Forest+Fires
- Аргументы.
Прогноз состояния продаваемой машины
- Краткое описание. Оценка истинной стоимости продаваемого автомобиля
- Базовый алгоритм.
- Данные. http://www.kaggle.com/c/DontGetKicked
- Аргументы.
Прогнозирование выплат по страховке
- Краткое описание. Прогнозирование выплат по страховке в случае ДТП на основании данных об автомобиле.
- Базовый алгоритм.
- Данные. http://www.kaggle.com/c/ClaimPredictionChallenge
- Аргументы.
Прогнозирование должностных зарплат
- Краткое описание. Прогнозирование должностных зарплат по ключевым необходимым навыкам.
- Базовый алгоритм.
- Данные. http://www.kaggle.com/c/job-salary-prediction/data
- Аргументы.
Локализация лиц на фотографии
- Краткое описание. Прогнозирование должностных зарплат по ключевым необходимым навыкам.
- Базовый алгоритм. http://www.cs.cmu.edu/~efros/courses/LBMV07/Papers/viola-cvpr-01.pdf
- Данные. http://vis-www.cs.umass.edu/lfw/
- Аргументы.