Участник:Denis Kochedykov

Материал из MachineLearning.

(Различия между версиями)

Перейти к: навигация, поиск

Версия 11:20, 8 мая 2009

Кочедыков Денис Алексеевич, Forecsys, ВЦ РАН(соискатель).

Научный руководитель Воронцов К.В..

Области научных интересов: теория машинного обучения, оценивание обобщающей способности, комбинаторика, статистика.

Написать письмо.

Структура кандидатской диссертации

Введение
1. Актуальность
2. Новизна: учет эффекта сходства и расслоения в оценках обобщающей способности в комбинаторном подходе
3. Апробация: ИОИ-2008, МФТИ-2007, МФТИ-2008, ММРО-2009(предстоит), семинары ВЦ РАН(предстоит)
4. Содержание работы по главам и личный вклад.

Обзорная часть
1. Проблема обобщающей способности. Обзор современных результатов: Вапника, Лэнгфорда, МакАллистера, и т.д.
2. Слабая вероятностная аксиоматика
3. Постановка задачи диссертации (основная задача диссертации пока не до конца ясна)

Известные оценки переведенные в слабую аксиоматику (содержательная глава №1)
1. Вапник
2. Лэнгфорд
3. Силл

Эффект сходства алгоритмов при оценивании вероятности переобучения (содержательная глава №2. основная.)
- Верхняя оценка вероятности возникновения переобучения в связном семействе при помощи неравенства типа Бонферрони
- Точное значение вероятности возникновения переобучения в цепочке алгоритмов без расслоения
- Точное значение вероятности пеореобучения метода МЭР на цепочке алгоритмов без расслоения
- Верхние оценки вероятности переобучения метода МЭР и вероятности возникновения переобучения для семейства, состоящего из множества цепочек без расслоения

Эксперименты
- Сравнение различных оценок

Состояние работы на текущий момент

В обзорной части
- Частично есть описание постановки задачи.
- Естественно, есть описание слабой вероятностной аксиоматики.
- Отсутствует обзор современного состояния по теме.

В главе про перевод известных оценок в комбинаторный вид
- Естественно, есть стандартная оценка Вапника.
- Из Лэнгфорда есть оценки Occam Razor, Shell, можно считать, что есть Microchoice, т.к. он переводится тривиально.
- Можно считать, что есть оценка Силла для связных семейств - разобрался, как она устроена, теперь легко можно ее записать в слабой аксиоматике.
- Других оценок нет. Нужен ли здесь перевод еще каких то известных оценок в слабую аксиоматику?

В главе про эффект сходства
- Есть верхняя оценка вероятности возникновения переобучения в связном семействе неравенством Бонферрони.
- Остального еще нет.

Ближайший план работы

Получить вероятность переобучения метода МЭР для худшего случая цепочки без расслоения. Это будет оценка с одновременным учетом и метода обучения и структуры сходства семейства.

Получить вероятность возникновения переобучения в цепочке без расслоения. Это будет полный учет структуры сходства семейства, без учета метода обучения.

Сравнить эти две последние оценки и оценку union bound(Вапник) - какой эффект дают учет структуры сходства и метода обучения.

Обычным union bound'ом получить для каждой из последних двух оценок оценку для семейства состоящего из цепочек без расслоения (здесь пока не совсем понятно - ведь слои в реальных семействах не обязательно представляют из себя цепочки). Для union bound'а нужно знать профиль - число алгоритмов в каждом слое. Его можно оценить по наблюдаемому профилю семейства так, как это делается в observable shell Лэнгфорда.

kochede 13:41, 8 мая 2009 (MSD)

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Denis_Kochedykov»

@@ Строка 59: / Строка 59: @@
 # Получить вероятность переобучения метода МЭР для худшего случая цепочки без расслоения. Это будет оценка с одновременным учетом и метода обучения и структуры сходства семейства.
 # Получить вероятность возникновения переобучения в цепочке без расслоения. Это будет полный учет структуры сходства семейства, без учета метода обучения.
 # Сравнить эти две последние оценки и оценку union bound(Вапник) - какой эффект дают учет структуры сходства и метода обучения.
-# Обычным union bound'ом получить для каждой из последних двух оценок оценку для семейства состоящего из цепочек без расслоения (здесь пока не совсем понятно - ведь слои в реальных семействах не обязательно представляют из себя цепочки). Для union bound'а нужно знать профиль - число алгоритмов в каждом слое. Его можно оценить по наблюдаемому профилю семейства так, как это делается в observable shell Лэнгфорда.
+# Обычным union bound'ом получить для каждой из последних двух оценок оценку для семейства состоящего из цепочек без расслоения ('''здесь пока не совсем понятно - ведь слои в реальных семействах не обязательно представляют из себя цепочки'''). Для union bound'а нужно знать профиль - число алгоритмов в каждом слое. Его можно оценить по наблюдаемому профилю семейства так, как это делается в observable shell Лэнгфорда.
 [[Участник:Denis Kochedykov|kochede]] 13:41, 8 мая 2009 (MSD)

Участник:Denis Kochedykov

Материал из MachineLearning.

Версия 11:20, 8 мая 2009

Структура кандидатской диссертации

Состояние работы на текущий момент

Ближайший план работы

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты