Участник:Anastasiya

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Весна 2014, 12-й семестр)
м (Другое)
 
(28 промежуточных версий не показаны.)
Строка 1: Строка 1:
__NOTOC__
__NOTOC__
-
'''МФТИ, ФУПМ'''
+
Анастасия Мотренко, аспирант факультета управления и прикладной математики МФТИ
Кафедра "'''Интеллектуальные системы'''"
Кафедра "'''Интеллектуальные системы'''"
Строка 6: Строка 6:
Направление "'''Интеллектуальный анализ данных'''"
Направление "'''Интеллектуальный анализ данных'''"
-
email: anastasia.motrenko@gmail.com
+
email: anastasiya.motrenko@phystech.edu
-
== Отчет о научно-исследовательской работе ==
+
* [[Медиа: Motrenko2016CV.pdf | Список работ и проектов к декабрю 2016 (pdf) ]]‎
-
[[Медиа: Motrenko2014CV.pdf | Список работ и проектов к лету 2014 (pdf) ]]‎
+
* [http://elibrary.ru/author_items.asp?authorid=821567 Список публикаций согласно elibrary.ru]
-
=== Весна 2011, 6-й семестр===
+
* [https://scholar.google.com/citations?hl=en&user=57ovHDMAAAAJ Список публикаций на GoogleScholar]
-
'''Использование теста Грейнджера при прогнозировании временных рядов'''
+
-
''При прогнозировании ряда бывает полезно определить, является ли данный ряд "зависимым" от некоторого другого ряда. Выявить подобную связь помогает тест Грейнджера, основанный на статистических тестах(при этом метод не гарантирует точного результата - при сравнении двух рядов, зависящих от еще одного ряда возможна ошибка). Метод применяется при прогнозировании экономических явлений и явлений природного характера (например, землятрясений). Цель работы - предложить алгоритм, наилучшим образом использующий данный метод; исследовать эффективность метода в зависимости от прогнозируемых рядов.''
+
= Научно-исследовательская работа =
-
'''Публикация'''
+
== Оценка объема выборки ==
-
*{{Статья
+
'''Публикации''':
-
|автор = Мотренко А.П.
+
# Aduenko A., Motrenko A., Strijov V. Object selection in credit scoring using covariance matrix of parameters estimations, accepted to Annals of Operations Research (January 2017) DOI: 10.1007/s10479-017-2417-3
-
|название = Использование теста Грейнджера при прогнозировании временных рядов
+
# Магистерская диссертация: Оценка объема выборки в задачах прогнозирования, МФТИ, 2014.
-
|журнал = Машинное обучение и анализ данных
+
# Motrenko A., Strijov V., Weber G.-W. Bayesian sample size estimation for logistic regression // Journal of Computational and Applied Mathematics, 2014, 255 — 743-752.
-
|год = 2011
+
# Мотренко А.П. Оценка необходимого объема выборки пациентов при прогнозировании сердечно-сосудистых заболеваний // Машинное обучение и анализ данных, 2012. № 3. — С. 354-366.
-
|номер = 1
+
# Мотренко А.П., Стрижов В.В. Многоклассовая логистическая регрессия // Известия ТулГУ, 2012. № 1. С. 153-162.
-
|ISSN = 2223-3792
+
-
|язык = russian
+
-
|страницы = 51-60
+
-
|url = http://mlalgorithms.svn.sourceforge.net/viewvc/mlalgorithms/JMLDA/2011no1/pdf/Motrenko2011Granger.pdf
+
-
}}
+
-
=== Осень 2011, 7-й семестр===
+
'''Доклады''':
-
'''Многоклассовый прогноз вероятности наступления инфаркта'''
+
# Мотренко А. П., [[Media:Motrenko2015MMPR.pdf|Оценка объема выборки в задачах классификации]] // Математические методы распознавания образов, г. Светлогорск, Калининградская область, 19-25 сентября 2015.
 +
# Motrenko A. Bayesian Sample Size Estimation for Patient Classification Survey // 20th Conference of the International Federation of Operational Research Societies, July, Barcelona, 2014.
 +
# Motrenko A. Small CVD sample set classification: generative versus discriminative // XXVI EURO conference, Rome, July 2013.
 +
# Motrenko A. Multiclass classification of cardio-vascular disease patients with sample size estimation // XXV EURO conference, Vilnius, July 2012.
-
''В работе описан алгоритм, позволяющий классифицировать четыре группы пациентов: перенесших инфаркт; больных, имеющих предрасположенность к инфаркту и здоровых пациентов двух групп. Признаками для определения состояния пациента служат измерения концентрации белков в крови. Одной из задач работы является выбор набора маркеров, оптимального для разделения между собой соответствующих групп. Классификация осуществляется по принципу «каждый против каждого», то есть решаются задачи классификации всевозможных пар групп. В силу высокой стоимости анализа крови, объемы данных невелики, поэтому одним из результатов исследования является оценка необходимого объема выборки пациентов.''
+
'''Гранты''':
 +
РФФИ 12-07-31095 мол_а, 14-07-31045 мол_а, грант на обучение в аспирантуре МФТИ
-
'''Публикация'''
+
== Прогнозирование временных рядов ==
-
*{{Статья
+
# Rudakov, V.V. Strizhov, D.O. Kashirin, M.P. Kuznetsov, A.P. Motrenko, M.M. Stenina. Selecting an Optimal Model for Forecasting the Volumes of Railway Goods Transportation // Automation and Remote Control, 2017, Vol. 78, No. 1, pp. 74-87. Original Russian Text published in Avtomatika i Telemekhanika, 2017, No. 1, pp. 91-105.
-
|автор = Мотренко А.П.
+
# Мотренко А.П., Рудаков К.В., Стрижов В.В. Учет влияния экзогенных факторов при непараметрическом прогнозировании временных рядов // Вестник Московского Университета. Серия 15. Вычислительная математика и кибернетика, 2016. Т. 36, №2, С.20-27. <br> Combining endogenous and exogenous variables in a special case of non-parametric time series forecasting model. ISSN 0278-6419, Moscow University Computational Mathematics and Cybernetics, 2016, Vol. 36, No. 2, pp. 71–78. c Allerton Press, Inc., 2016.
-
|название = Многоклассовый прогноз вероятности наступления инфаркта
+
# Журавлев Ю.И. и др. Методы прогнозирования временных рядов на примере железнодорожных грузоперевозок // Вестник российской академии наук, 2016, том 86, № 2, с. 33–38.
-
|журнал = Машинное обучение и анализ данных
+
# Мотренко А. П., Стрижов B. B. [http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group874/Motrenko2014KL/doc/MotrenkoStrijov2014.pdf Построение агрегированных прогнозов объемов железнодорожных грузоперевозок] // Информатика и ее применения, 2014. Т. 8, № 2. С. 86-97.
-
|год = 2011
+
# Вальков А.С., Кожанов Е.М., Мотренко А.П., Хусаинов Ф.И. Построение кросс-корреляционных зависимостей при прогнозе загруженности железнодорожного узла // Машинное обучение и анализ данных, 2013. № 5. С. 503-517. ISSN 2223-3792.
-
|номер = 2
+
# Мотренко А.П. Использование теста Грейнджера при прогнозировании временных рядов // Машинное обучение и анализ данных. 2011. № 1. С. 51-60.
-
|ISSN = 2223-3792
+
-
|язык = russian
+
-
|страницы = 225-235
+
-
|url = http://mlalgorithms.svn.sourceforge.net/viewvc/mlalgorithms/JMLDA/2011no2/pdf/Motrenko2011HAPrediction.pdf
+
-
}}
+
 +
'''Гранты''':
 +
РФФИ 13-07-13139 офи_м_РЖД, 14-07-31046 мол_а, грант Министерства образования и науки Российской Федерации (соглашение RFMEFI60414X0041)
-
=== Весна 2012, 8-й семестр ===
+
== Другое ==
-
 
+
# A. Motrenko, V. Strijov. Multi-way Feature Selection for ECoG-based Brain-Computer Interface // Expert Systems with Applications Available online 18 July 2018 to 25 September via [https://authors.elsevier.com/a/1XW1c3PiGT7ggJ]
-
'''Оценка необходимого объема выборки пациентов при прогнозировании сердечно-сосудистых заболеваний'''
+
# Гасанов Э.Э., Мотренко А.П. Построение аппроксимирующего описания скалограммы в задаче прогнозирования движений по электрокортикограмме // Машинное обучение и анализ данных, 2017. T. 3. № 2. C. 160-169.
-
 
+
# Молибог И.О., Мотренко А.П., Стрижов В.В. Повышение качества классификации в задаче обнаружения внутреннего плагиата // Информатика и её применения, 2017, Т. 11, Вып. 3. 59 - 71.
-
''В работе описан алгоритм классификации пациентов, перенесших инфаркт и имеющих предрасположенность к инфаркту. Признаками для определения состояния пациента служат измерения концентрации белков в крови. Решается задача оценки параметров функции регрессии и выбора признаков в логистической регрессии. Предполагается, что объем данных недостаточен, поэтому в работе предлагается способ оценки необходимого объема выборки.''
+
# Motrenko A., Strijov V. Extracting fundamental periods to segment biomedical signals // Journal of Biomedical and Health Informatics, 2016, Vol. 20, No. 6, 1466 - 1476.
-
 
+
-
'''Публикации'''
+
-
*{{Статья
+
-
|автор = Мотренко А.П.
+
-
|название = Оценка необходимого объема выборки пациентов при прогнозировании сердечно-сосудистых заболеваний
+
-
|журнал = Машинное обучение и анализ данных
+
-
|год = 2012
+
-
|номер = 3
+
-
|ISSN = 2223-3792
+
-
|язык = russian
+
-
|страницы = 354-366
+
-
|url = http://mlalgorithms.svn.sourceforge.net/viewvc/mlalgorithms/JMLDA/2012no3/pdf/Motrenko2012SampleSize.pdf
+
-
}}
+
-
*{{Статья
+
-
|автор = Мотренко А.П.
+
-
|автор2 = Стрижов В.В.
+
-
|название = Многоклассовая логистическая регрессия
+
-
|журнал = Известия ТулГУ
+
-
|год = 2012
+
-
|выпуск = 1
+
-
|ISSN = 2071-6176
+
-
|язык = russian
+
-
|страницы = 153-162
+
-
+
-
}}
+
-
 
+
-
+
-
 
+
-
'''Доклад на научной конференции'''
+
-
*{{Статья
+
-
|автор = Мотренко А.П.
+
-
|название = Многоклассовый прогноз вероятности наступления инфаркта
+
-
|журнал = XIX Международная конференция студентов, аспирантов и молодых ученых «Ломоносов», апрель
+
-
|год = 2012
+
-
|язык = russian
+
-
|url = http://lomonosov-msu.ru/archive/Lomonosov_2012/structure_16_1797.htm
+
-
}}
+
-
*{{Статья
+
-
|автор = Мотренко А.П.
+
-
|название = Multiclass classification of cardio-vascular disease patients with sample size estimation
+
-
|журнал = XXV EURO conference, июль
+
-
|год = 2012
+
-
|язык = english
+
-
|url = http://www.euro-online.org/conf/display.php?page=slot&day=T&time=D&track=44
+
-
}}
+
-
 
+
-
'''Гранты'''
+
-
*«Многоклассовая логистическая регрессия», ПГАС
+
-
 
+
-
=== Осень 2012, 9-й семестр ===
+
-
 
+
-
'''Оценка плотности совместного распределения'''
+
-
 
+
-
В задачах классификации часто возникает ситуация, когда часть
+
-
переменных распределена непрерывно, а часть~--- дискретно.
+
-
Например, в логистической регрессии признаки непрерывны, а
+
-
переменная отклика подчиняется распределению Бернулли. В работе
+
-
описан способ оценки плотности совместного неоднородного
+
-
распределения, включающего дискретные и непрерывные величины.
+
-
Рассмотрен случай, когда вероятностные предположения о
+
-
распределении случайных величин сделать не удается. В этом случае
+
-
применяются методы ядерного сглаживания. В работе также приводится
+
-
их сравнение с классическими методами теории вероятностей.
+
-
Эксперимент проводится на реальных и синтетических данных.
+
-
 
+
-
 
+
-
'''Публикации'''
+
-
*{{Статья
+
-
|автор = Мотренко А.П.
+
-
|название = Оценка плотности совместного распределения
+
-
|журнал = Машинное обучение и анализ данных
+
-
|год = 2013
+
-
|номер = 4
+
-
|ISSN = 2223-3792
+
-
|язык = russian
+
-
|страницы = 428-435
+
-
+
-
}}
+
-
+
-
 
+
-
'''Доклад на научной конференции'''
+
-
*{{Статья
+
-
|автор = Мотренко А.П.
+
-
|название = Многоклассовый мультимодельный прогноз вероятности наступления инфаркта
+
-
|журнал = Труды 55-ой научной конференции МФТИ
+
-
|год = 2012
+
-
|язык = russian
+
-
|url = http://lomonosov-msu.ru/archive/Lomonosov_2012/structure_16_1797.htm
+
-
}}
+
-
 
+
-
 
+
-
'''Гранты'''
+
-
*«Многоклассовая логистическая регрессия», ПГАС
+
-
* РФФИ 12-07-31095
+
-
 
+
-
=== Весна 2013, 10-й семестр ===
+
-
 
+
-
''' Построение кросс-корреляционных зависимостей при прогнозе загруженности железнодорожного узла'''
+
-
 
+
-
Рассматривается проблема обнаружения причинно-следственных связей в разнородных временных рядах. Предлагается прогностическая модель, использующая выявленные связи. Модель предназначена для прогнозирования загруженности железнодорожного узла. Модель использует как исторические данные о загруженности, так и внешние данные: биржевые цены на основные инструменты и нормативные документы. При построении модели используются экспертные высказывания относительно вида связей. Предложен метод оценки достоверности экспертных высказываний. Метод проиллюстрирован данными грузовых перевозок РЖД.
+
-
 
+
-
 
+
-
*{{Статья
+
-
|автор = Вальков А.С., Кожанов Е.М., Мотренко А.П., Хусаинов Ф.И.
+
-
|название = Построение кросс-корреляционных зависимостей при прогнозе загруженности железнодорожного узла
+
-
|журнал = Машинное обучение и анализ данных
+
-
|год = 2013
+
-
|номер = 5
+
-
|ISSN = 2223-3792
+
-
|язык = russian
+
-
|страницы = 503-517
+
-
+
-
}}
+
-
 
+
-
 
+
-
'''Доклад на научной конференции'''
+
-
*{{Статья
+
-
|автор = Мотренко А.П.
+
-
|название = Разделяющие и порождающие алгоритмы классификации малых выборок |Ломоносов-2013
+
-
|год = 2013
+
-
|язык = russian
+
-
|url = http://lomonosov-msu.ru/archive/Lomonosov_2012/structure_16_1797.htm
+
-
}}
+
-
*{{Статья
+
-
|автор = Мотренко А.П.
+
-
|название = Small CVD sample set classification: generative versus discriminative
+
-
|журнал = XXV EURO conference, июль
+
-
|год = 2013
+
-
|язык = english
+
-
|url = http://www.euro-online.org/conf/display.php?page=slot&day=T&time=D&track=44
+
-
}}
+
-
 
+
-
'''Гранты'''
+
-
*«Многоклассовая логистическая регрессия», ПГАС
+
-
* РФФИ 12-07-31095
+
-
 
+
-
=== Осень 2013, 11-й семестр ===
+
-
 
+
-
''' Sample Size Determination for Logistic Regression'''
+
-
 
+
-
The problem of sample size estimation is important in medical applications, especially in cases of expensive measurements of
+
-
immune biomarkers. This paper describes the problem of logistic regression analysis with the sample size determination algorithms
+
-
namely the methods of univariate statistics, logistics regression, cross-validation and Bayesian inference. The authors, treating the
+
-
regression model parameters as a multivariate variable, propose to estimate the sample size using the distance between parameter
+
-
distribution functions on cross-validated data sets. Herewith, the authors give a new contribution to data mining and statistical learning, supported by applied mathematics.
+
-
 
+
-
'''Опубликована статья:'''
+
-
 
+
-
Motrenko A., Strijov V., Weber G.-W. Bayesian sample size estimation for logistic regression // Journal of Computational and Applied Mathematics, 2014, 255 — 743-752.
+
-
 
+
-
 
+
-
'''Тезисы на научной конференции'''
+
-
*{{Статья
+
-
|автор = Мотренко А.П.
+
-
|название = Сравнение порождающего и разделяющего подходов к классификации малых выборок
+
-
|журнал = Труды 56-ой научной конференции МФТИ
+
-
|год = 2013
+
-
|язык = russian
+
-
|страницы = 100-101
+
-
|url = http://science.phystech.edu/56conf/f_6dadr1/c_6daeml
+
-
}}
+
-
 
+
-
=== Весна 2014, 12-й семестр ===
+
-
''' Построение агрегированных прогнозов объемов железнодорожных грузоперевозок'''
+
-
 
+
-
Данное исследование посвящено проблеме построения агрегированных прогнозов объемов железнодорожных грузоперевозок. Для получения агрегированных прогнозов требуется кластеризовать временные ряды таким образом, чтобы распределение временных рядов внутри кластера совпадали. При решении задачи кластеризации требуется оценить близость между временными рядами, исходя из их эмпирических распределений. Вводится критерий принадлежности временных рядов одному распределению, основанный на расстоянии Кульбака-Лейблера между гистограммами временных рядов. Приводится теоретическое и практическое исследование предложенного критерия. Решается задача кластеризации временных рядов на основе матрицы парных расстояний между ними.
+
-
 
+
-
'''Подготовлена статья:'''
+
-
*{{Статья
+
-
|автор = Мотренко А. П., Стрижов B. B.
+
-
|название = Построение агрегированных прогнозов объемов железнодорожных грузоперевозок
+
-
|журнал = Информатика и ее применения
+
-
|том = 8
+
-
|номер = 2
+
-
|год = 2014
+
-
|язык = russian
+
-
}}
+
-
 
+
-
'''Сегментирование акслерометрических временных рядов, описывающих движение человека'''
+
-
The paper addresses a problem of sensor-based time series segmentation as a part of human activity recognition problem. We assume that each studied time series contains a fundamental periodic which can be seen as an ultimate entity (cycle) of motion. Due to the nature of the data and the urge to obtain interpretable results of segmentation, we define the segmentation as a partition of the time series into the periods of this fundamental periodic. To split the time series into periods we select a pair of principal components of the Hankel matrix. We then cut the trajectory of the selected principal components by its symmetry axis, thus obtaining half-periods that are merged into segments. A method of selecting a pair of components, corresponding to the fundamental periodic is proposed.
+
-
 
+
-
'''Подготовлена статья:'''
+
-
*{{Статья
+
-
|автор = Motrenko A., Strijov V. et al.
+
-
|название = Extracting fundamental periods to segment human motion time series
+
-
|год = 2015
+
-
|язык = english
+
-
}}
+
-
 
+
-
'''Доклад на научной конференции'''
+
-
*{{Статья
+
-
|автор = Motrenko A.
+
-
|название = Bayesian Sample Size Estimation for Patient Classification Survey
+
-
|журнал = 20th Conference of the International Federation of Operational Research Societies, July
+
-
|год = 2014
+
-
|язык = english
+
-
|url = http://www.ifors2014.org/
+
-
}}
+

Текущая версия

Анастасия Мотренко, аспирант факультета управления и прикладной математики МФТИ

Кафедра "Интеллектуальные системы"

Направление "Интеллектуальный анализ данных"

email: anastasiya.motrenko@phystech.edu

Научно-исследовательская работа

Оценка объема выборки

Публикации:

  1. Aduenko A., Motrenko A., Strijov V. Object selection in credit scoring using covariance matrix of parameters estimations, accepted to Annals of Operations Research (January 2017) DOI: 10.1007/s10479-017-2417-3
  2. Магистерская диссертация: Оценка объема выборки в задачах прогнозирования, МФТИ, 2014.
  3. Motrenko A., Strijov V., Weber G.-W. Bayesian sample size estimation for logistic regression // Journal of Computational and Applied Mathematics, 2014, 255 — 743-752.
  4. Мотренко А.П. Оценка необходимого объема выборки пациентов при прогнозировании сердечно-сосудистых заболеваний // Машинное обучение и анализ данных, 2012. № 3. — С. 354-366.
  5. Мотренко А.П., Стрижов В.В. Многоклассовая логистическая регрессия // Известия ТулГУ, 2012. № 1. С. 153-162.

Доклады:

  1. Мотренко А. П., Оценка объема выборки в задачах классификации // Математические методы распознавания образов, г. Светлогорск, Калининградская область, 19-25 сентября 2015.
  2. Motrenko A. Bayesian Sample Size Estimation for Patient Classification Survey // 20th Conference of the International Federation of Operational Research Societies, July, Barcelona, 2014.
  3. Motrenko A. Small CVD sample set classification: generative versus discriminative // XXVI EURO conference, Rome, July 2013.
  4. Motrenko A. Multiclass classification of cardio-vascular disease patients with sample size estimation // XXV EURO conference, Vilnius, July 2012.

Гранты: РФФИ 12-07-31095 мол_а, 14-07-31045 мол_а, грант на обучение в аспирантуре МФТИ

Прогнозирование временных рядов

  1. Rudakov, V.V. Strizhov, D.O. Kashirin, M.P. Kuznetsov, A.P. Motrenko, M.M. Stenina. Selecting an Optimal Model for Forecasting the Volumes of Railway Goods Transportation // Automation and Remote Control, 2017, Vol. 78, No. 1, pp. 74-87. Original Russian Text published in Avtomatika i Telemekhanika, 2017, No. 1, pp. 91-105.
  2. Мотренко А.П., Рудаков К.В., Стрижов В.В. Учет влияния экзогенных факторов при непараметрическом прогнозировании временных рядов // Вестник Московского Университета. Серия 15. Вычислительная математика и кибернетика, 2016. Т. 36, №2, С.20-27.
    Combining endogenous and exogenous variables in a special case of non-parametric time series forecasting model. ISSN 0278-6419, Moscow University Computational Mathematics and Cybernetics, 2016, Vol. 36, No. 2, pp. 71–78. c Allerton Press, Inc., 2016.
  3. Журавлев Ю.И. и др. Методы прогнозирования временных рядов на примере железнодорожных грузоперевозок // Вестник российской академии наук, 2016, том 86, № 2, с. 33–38.
  4. Мотренко А. П., Стрижов B. B. Построение агрегированных прогнозов объемов железнодорожных грузоперевозок // Информатика и ее применения, 2014. Т. 8, № 2. С. 86-97.
  5. Вальков А.С., Кожанов Е.М., Мотренко А.П., Хусаинов Ф.И. Построение кросс-корреляционных зависимостей при прогнозе загруженности железнодорожного узла // Машинное обучение и анализ данных, 2013. № 5. С. 503-517. ISSN 2223-3792.
  6. Мотренко А.П. Использование теста Грейнджера при прогнозировании временных рядов // Машинное обучение и анализ данных. 2011. № 1. С. 51-60.

Гранты: РФФИ 13-07-13139 офи_м_РЖД, 14-07-31046 мол_а, грант Министерства образования и науки Российской Федерации (соглашение RFMEFI60414X0041)

Другое

  1. A. Motrenko, V. Strijov. Multi-way Feature Selection for ECoG-based Brain-Computer Interface // Expert Systems with Applications Available online 18 July 2018 to 25 September via [1]
  2. Гасанов Э.Э., Мотренко А.П. Построение аппроксимирующего описания скалограммы в задаче прогнозирования движений по электрокортикограмме // Машинное обучение и анализ данных, 2017. T. 3. № 2. C. 160-169.
  3. Молибог И.О., Мотренко А.П., Стрижов В.В. Повышение качества классификации в задаче обнаружения внутреннего плагиата // Информатика и её применения, 2017, Т. 11, Вып. 3. 59 - 71.
  4. Motrenko A., Strijov V. Extracting fundamental periods to segment biomedical signals // Journal of Biomedical and Health Informatics, 2016, Vol. 20, No. 6, 1466 - 1476.
Личные инструменты