Участник:Anastasiya

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 30: Строка 30:
'''Многоклассовый прогноз вероятности наступления инфаркта'''
'''Многоклассовый прогноз вероятности наступления инфаркта'''
-
''В работе описан алгоритм, позволяющий классифицировать четыре группы пациентов:
+
''В работе описан алгоритм, позволяющий классифицировать четыре группы пациентов: перенесших инфаркт; больных, имеющих предрасположенность к инфаркту и здоровых пациентов двух групп. Признаками для определения состояния пациента служат измерения концентрации белков в крови. Одной из задач работы является выбор набора маркеров, оптимального для разделения между собой соответствующих групп. Классификация осуществляется по принципу «каждый против каждого», то есть решаются задачи классификации всевозможных пар групп. В силу высокой стоимости анализа крови, объемы данных невелики, поэтому одним из результатов исследования является оценка необходимого объема выборки пациентов.''
-
перенесших инфаркт; больных, имеющих предрасположенность к инфаркту и здоровых
+
-
пациентов двух групп. Признаками для определения состояния пациента служат измере-ния концентрации белков в крови. Одной из задач работы является выбор набора маркеров, оптимального для разделения между собой соответствующих групп. Классификация
+
-
осуществляется по принципу «каждый против каждого», то есть решаются задачи классификации всевозможных пар групп. В силу высокой стоимости анализа крови, объемы данных невелики, поэтому одним из результатов исследования является оценка необходи-мого объема выборки пациентов.''
+
'''Публикация'''
'''Публикация'''
Строка 53: Строка 50:
'''Оценка необходимого объема выборки пациентов при прогнозировании сердечно-сосудистых заболеваний'''
'''Оценка необходимого объема выборки пациентов при прогнозировании сердечно-сосудистых заболеваний'''
-
''В работе описан алгоритм классификации пациентов, перенесших инфаркт и имеющих предрасположенность к инфаркту. Признаками для определения состояния пациента служат измерения концентрации белков в крови. Решается задача оценки параметров функции регрессии и выбора признаков в логистической регрессии. Предполагается, что объем
+
''В работе описан алгоритм классификации пациентов, перенесших инфаркт и имеющих предрасположенность к инфаркту. Признаками для определения состояния пациента служат измерения концентрации белков в крови. Решается задача оценки параметров функции регрессии и выбора признаков в логистической регрессии. Предполагается, что объем данных недостаточен, поэтому в работе предлагается способ оценки необходимого объема выборки.''
-
данных недостаточен, поэтому в работе предлагается способ оценки необходимого объема выборки.''
+
'''Публикации'''
'''Публикации'''
Строка 70: Строка 66:
*{{Статья
*{{Статья
|автор = Мотренко А.П.
|автор = Мотренко А.П.
 +
|автор2 = Стрижов В.В.
|название = Многоклассовая логистическая регрессия
|название = Многоклассовая логистическая регрессия
|журнал = Известия ТулГУ
|журнал = Известия ТулГУ

Версия 20:11, 29 мая 2012

МФТИ, ФУПМ

Кафедра "Интеллектуальные системы"

Направление "Интеллектуальный анализ данных"

email: anastasia.motrenko@gmail.com

Отчет о научно-исследовательской работе

Весна 2011, 6-й семестр

Использование теста Грейнджера при прогнозировании временных рядов

При прогнозировании ряда бывает полезно определить, является ли данный ряд "зависимым" от некоторого другого ряда. Выявить подобную связь помогает тест Грейнджера, основанный на статистических тестах(при этом метод не гарантирует точного результата - при сравнении двух рядов, зависящих от еще одного ряда возможна ошибка). Метод применяется при прогнозировании экономических явлений и явлений природного характера (например, землятрясений). Цель работы - предложить алгоритм, наилучшим образом использующий данный метод; исследовать эффективность метода в зависимости от прогнозируемых рядов.

Публикация

Осень 2011, 7-й семестр

Многоклассовый прогноз вероятности наступления инфаркта

В работе описан алгоритм, позволяющий классифицировать четыре группы пациентов: перенесших инфаркт; больных, имеющих предрасположенность к инфаркту и здоровых пациентов двух групп. Признаками для определения состояния пациента служат измерения концентрации белков в крови. Одной из задач работы является выбор набора маркеров, оптимального для разделения между собой соответствующих групп. Классификация осуществляется по принципу «каждый против каждого», то есть решаются задачи классификации всевозможных пар групп. В силу высокой стоимости анализа крови, объемы данных невелики, поэтому одним из результатов исследования является оценка необходимого объема выборки пациентов.

Публикация


Весна 2012, 8-й семестр

Оценка необходимого объема выборки пациентов при прогнозировании сердечно-сосудистых заболеваний

В работе описан алгоритм классификации пациентов, перенесших инфаркт и имеющих предрасположенность к инфаркту. Признаками для определения состояния пациента служат измерения концентрации белков в крови. Решается задача оценки параметров функции регрессии и выбора признаков в логистической регрессии. Предполагается, что объем данных недостаточен, поэтому в работе предлагается способ оценки необходимого объема выборки.

Публикации

  • Мотренко А.П. Оценка необходимого объема выборки пациентов при прогнозировании сердечно-сосудистых заболеваний // Машинное обучение и анализ данных. — 2011. — № 2. — С. 354-366. — ISSN 2223-3792.
  • Мотренко А.П., Стрижов В.В. Многоклассовая логистическая регрессия // Известия ТулГУ. — 2012. — № 1. — С. 153-162. — ISSN 2071-6176.

Доклад на научной конференции

Гранты

  • «Многоклассовая логистическая регрессия», ПГАС

Название дипломной работы

Оценка необходимого объема выборки в задачах логистической регрессии
Личные инструменты