Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 974, весна 2012

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии)
(Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии)
Строка 149: Строка 149:
== Аннотации ==
== Аннотации ==
=== Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии ===
=== Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии ===
-
Логистическая регрессия – это статистическая модель, которая применяется для предсказания вероятности возникновения некоторого события по значениям множества признаков. Она находит применение, например, в медицине<ref name="Motoya Machida"></ref http://math.tntech.edu/machida/MSD/lecture7.pdf> и кредитном скроллинге. В реальных условиях число признаков обычно велико, и важнейшей задачей является выбор только существенных признаков , а также поиск объектов, которые по тем или иным причинам являются атипичными.
+
Логистическая регрессия – это статистическая модель, которая применяется для предсказания вероятности возникновения некоторого события по значениям множества признаков. Она находит применение, например, в медицине<ref name="Motoya Machida" http://math.tntech.edu/machida/MSD/lecture7.pdf></ref> и кредитном скроллинге. В реальных условиях число признаков обычно велико, и важнейшей задачей является выбор только существенных признаков , а также поиск объектов, которые по тем или иным причинам являются атипичными.
Ключевые слова: logit model, feature selection, boosting.
Ключевые слова: logit model, feature selection, boosting.

Версия 14:42, 14 марта 2012


Список задач

Название задачи Автор Рецензент Ссылка на работу Комментарии
Алгоритмы нахождения гауссовских смесей (пример) Александра Цимбалюк Татьяна Шпакова
Локальные методы прогнозирования с выбором инвариантного преобразования Цыганова Светлана Медведникова Мария сa
Аппроксимация эмпирических функций распределения (пример) Иванова Алина с
Построение рейтинга российских вузов по открытым данным об успешности карьеры их выпускников (пример) Мария Медведникова Светлана Цыганова с
CMARS: аппроксимация сплайнами (пример) Целых Влада с
Кластеризация и составление словаря аминокислотных последовательностей Шпакова Татьяна Целых Влада
Анализ текста методами структурного обучения Бочкарева Валерия с
Сравнение методов ARMA и FLS при ретроспективном прогнозировании (пример) Макаров Виктор
Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии (пример) Степан Лобастов с
Александр Адуенко сa
Многоуровневая классификация при обнаружении движения цен (пример) Арсентий Кузьмин с
Егор Клочков с
Локальные методы прогнозирования с выбором метрики (пример) Анна Варфоломеева с

Общий план работ

Дата Что делаем Результат для обсуждения
Февраль 29 Выбрана задача, найдены базовые публикации. Аннотация, 600 знаков.
Март 7 Собрана литература, она в bib; найдены данные. Введение, примерно одна страница.
14 Поставлена задача, собраны материалы по работе. Найдены публикации. Постановка задачи, полстраницы.
21 Поставлен вычислительный эксперимент, получены первые результаты. Визуализация данных.
28 Описание алгоритма, часть 1. Теоретическая часть.
Апрель 4 Описание алгоритма, часть 2. Теоретическая часть завершена.
11 Завершение вычислительного эксперимента. Контрольная точка - показ статьи в целом.
18 Доработка статьи. Доклад, первая группа.
25 Подача статьи в журнал. Доклад, вторая группа.

Аннотации

Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии

Логистическая регрессия – это статистическая модель, которая применяется для предсказания вероятности возникновения некоторого события по значениям множества признаков. Она находит применение, например, в медицинеОшибка цитирования Неверный вызов: нет входных данных и кредитном скроллинге. В реальных условиях число признаков обычно велико, и важнейшей задачей является выбор только существенных признаков , а также поиск объектов, которые по тем или иным причинам являются атипичными.

Ключевые слова: logit model, feature selection, boosting.

Построение рейтинга российских вузов по открытым данным об успешности карьеры их выпускников (пример)

Построение интегрального индикатора - введение отношения порядка на множестве сравнимых объектов. Предполагается, что каждый объект описан вектором, компоненты которого являются результатами измерений соответствующих показателей. Все измерения выполены в линейных шкалах. Интеграральный индикатор - скаляр, поставленный в соответствие объекту. Интегральный индикатор для набора объектов - вектор, компоненты которого поставлены в соответствие сравниваемым объектам.

Распространенным алгоритмом построения интегральных индикаторов для объектов, описанных в линейных шкалах, является линейная комбинация значений показателей. Основная задача заключается в определении весов показателей.

Существуют две основные разновидности рассматриваемой задачи:

  • Построение интегрального индикатора методом "с учителем"

есть экспертные оценки качества объектов и важности показателей

необходимо согласовать значения интегрального индикатора и весов показателей

  • Построение интегрального индикатора методом "без учителя"

веса вычисляются исходя из некоторого заданного критерия информативности описаний.

Черновой список задач

  1. Кластеризация и составление словаря аминокислотных последовательностей (пример)
  2. Oblique decision trees: алгоритм Яндекс для системы Полигон (пример)
  3. Сравнительный анализ регрессионных остатков в SVN-регрессии (пример)
  4. Алгоритмы нахождения гауссовских смесей (пример)
  5. Аппроксимация эмпирических функций распределения (пример)
  6. Прогноз квазипериодических многомерных временных рядов непараметрическими методами (пример)
  7. Многоуровневая классификация при обнаружении движения цен (пример)
  8. Анализ текста методами структурного обучения (пример)
  9. CMARS: аппроксимация сплайнами (пример)
  10. Полиномы Чебышева и метод прогонки при прогнозировании временных рядов (пример)
  11. Сравнение методов ARMA и FLS при ретроспективном прогнозировании (пример)
  12. Локальные методы прогнозирования с выбором метрики (пример)
  13. Локальные методы прогнозирования с выбором инвариантного преобразования (пример)
  14. Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии (пример)
  15. Векторная авторегрессия и управление макроэкономическими показателями (пример)
  16. Построение рейтинга российских вузов по открытым данным об успешности карьеры их выпускников (пример)
  17. К рейтинга российских вузов по открытым данным об успешности карьеры их выпускников (пример)

Ещё задачи

  1. Алгоритмические основы построения банковских скоринговых карт (пример)
  2. Сингулярное разложение и поисковая машина (пример)
  3. Сравнение алгоритмов многокритериальной оптимизации (пример)
  4. Уточнение экспертных оценок на данных в ранговых шкалах (интервальные, конусы, веса экспертов, копулы)
  5. Уточнение экспертных оценок при анализе работы механизма устойчивого развития энергетики
  6. Кластеризация (пример) [1]
  7. Визуализация пространства параметров регрессионных моделей
  8. Восстановление регрессии методом главных компонент
  9. Оценка гиперпараметров путем сэмплирования
  10. Прореживание существенно нелинейных моделей с помощью гиперпараметров
  11. Фактор Оккама для параметрических моделей с известной областью определения параметров
  12. Создание алгоритмов последовательной модификации моделей
  13. Порождение и выбор моделей классификации

Составить

  • Список типичных типографических ошибок
  • Список ошибок BibTeX
Личные инструменты