Участник:Oleg Bakhteev

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (Осень 2014, 9 семестр)
(Осень 2014, 9 семестр)
Строка 17: Строка 17:
== Осень 2014, 9 семестр ==
== Осень 2014, 9 семестр ==
-
'''Восстановление пропущенных значений по метризованной выборке в разнородных шкалах'''<br/>
+
'''Восстановление пропущенных значений в разнородных шкалах с большим числом пропусков'''<br/>
-
В работе рассматривается проблема заполнения большого количества пропусков в выборке в задачах анализа данных. Основной трудностью, связанной с заполнением пропусков, является неустойчивость полученной модели при уточнении части пропущенных данных. В работе изучается подход, основанный на заполнении данных методом ближайшего соседа, производится оценка точности заполнения пропусков в условиях равномерной непрерывности заполняющих функций. <br/>
+
Рассматривается задача восстановления пропущенных значений в выборках, содер-
 +
жащих значительное число пропусков. Вводится понятие устойчивости восстановления
 +
пропуска, а также исследуется возможность применимости подхода для восстановления
 +
пропущенных значений. Исследуется случай, когда восстановление производится по k бли-
 +
жайшим соседям. Рассматриваются теоретические аспекты применимости данного под-
 +
хода для сильно разреженных данных. Рассматривается вариант восстановления пропу-
 +
щенных значений с использованием восстановленных значений в качестве источника для
 +
восстановления других элементов. <br/>
'''Публикация'''<br/>
'''Публикация'''<br/>
-
Бахтеев О.Ю., Стрижов В.В. Восстановление пропущенных значений по метризованной выборке в разнородных шкалах (готовится к подаче).
+
Бахтеев О.Ю. Восстановление пропущенных значений в
-
[http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group074/Bakhteev2014MissData/doc/miss2.pdf?format=raw PDF]
+
разнородных шкалах с большим числом пропусков (готовится к подаче).
-
 
+
[http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group074/Bakhteev2014MissData/doc/miss3.pdf?format=raw PDF]
-
 
+
-
'''Согласование экспертных оценок с большим количеством пропущенных значений'''<br/>
+
-
Рассматривается задача согласования экспертных оценок в условиях, когда каждый эксперт дает оценки по небольшой доле оцениваемых объектов. Для каждого эксперта задан частичный порядок на множестве признаковой значимости. Также предполагается, что для каждого эксперта задана значимость его оценок в итоговом согласованном решении. Проводится обзор существующих решений. Предлагается метод решения рассматриваемой задачи, основанный на методе Парето-расслоения. <br/>
+
-
 
+
-
'''Публикация'''<br/>
+
-
Бахтеев О.Ю., Стрижов В.В. Согласование экспертных оценок с большим количеством пропущенных значений (готовится к подаче).
+
-
[http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group074/Bakhteev2014MultiExpert/doc/multiexpert.pdf?format=raw PDF]
+

Версия 19:36, 22 июня 2015

Бахтеев Олег Юрьевич
МФТИ, ФУПМ
Кафедра «Интеллектуальные системы»
Направление «Интеллектуальный анализ данных»
bakhteev@phystech.edu


Весна 2014, 8 семестр

Восстановление панельной матрицы и ранжирующей модели по метризованной выборке в разнородных шкалах
Работа посвящена восстановлению ежегодных изменений рейтингов студентов при собеседовании в учебный центр. Рассматривается выборка, состоящая з экспертных оценок студентов, проходивших собеседование в учебный центр в течение нескольких лет и итоговых рейтингов студентов. Шкалы экспертных оценок меняются из года в год, но шкала рейтингов остается неизменной. Требуется восстановить ранжирующую модель, не зависящую от времени. Задача сводится к восстановлению панельной матрицы (то есть матрицы объект–признак–год), ставящей во взаимное соответствие некоторого студента (или усредненный “портрет” студента) и его предполагаемую оценку на собеседованиях за каждый год, и исследованию ранжирующей модели, полученной на основе этой матрицы, а так же анализу ее устойчивости на протяжении нескольких лет. Предлагается метод восстановления панельной матрицы, основанный на решении многомерной задачи о назначениях. В качестве метода восстановления ранжирующей модели используется алгоритм многоклассовой классификации с отношением полного порядка на классах и алгоритм ранжирования, основанный на методе опорных векторов.
Публикация
Bakhteev O.Y., Strijov V.V. Panel matrix and ranking model recovery using mixed-scale measured data // Central European Journal of Operations Research (CEJOR) (подано). PDF

Доклад на конференции
57-ая конференция МФТИ: доклад "Восстановление панельной матрицы и ранжирующей модели в разнородных шкалах"


Осень 2014, 9 семестр

Восстановление пропущенных значений в разнородных шкалах с большим числом пропусков
Рассматривается задача восстановления пропущенных значений в выборках, содер- жащих значительное число пропусков. Вводится понятие устойчивости восстановления пропуска, а также исследуется возможность применимости подхода для восстановления пропущенных значений. Исследуется случай, когда восстановление производится по k бли- жайшим соседям. Рассматриваются теоретические аспекты применимости данного под- хода для сильно разреженных данных. Рассматривается вариант восстановления пропу- щенных значений с использованием восстановленных значений в качестве источника для восстановления других элементов.


Публикация
Бахтеев О.Ю. Восстановление пропущенных значений в разнородных шкалах с большим числом пропусков (готовится к подаче). PDF

Личные инструменты