Публикация:Воронцов 2010 Комбинаторная теория
Материал из MachineLearning.
Воронцов, К. В. Комбинаторная теория надёжности обучения по прецедентам: Дис. док. физ.-мат. наук: 05-13-17. — Вычислительный центр РАН, 2010. — 271 с.
BibTeX: |
@phdthesis{voron10doct, author = "Воронцов, К. В.", title = "Комбинаторная теория надёжности обучения по прецедентам: Дис. док. физ.-мат. наук: 05-13-17", school = "Вычислительный центр РАН", pages = "271", url = "http://www.machinelearning.ru/wiki/images/b/b6/Voron10doct.pdf", year = "2010", language = russian } |
Данная диссертационная работа является теоретическим исследованием по теории статистического обучения (statistical learning theory, SLT). Предлагается комбинаторный подход, позволяющий получать точные оценки обобщающей способности методов обучения по прецедентам. Отличительными особенностями комбинаторного подхода являются:
- использование слабой вероятностной аксиоматики вместо стандартной колмогоровской;
- использование функционалов вероятности переобучения и полного скользящего контроля вместо стандартного принципа равномерной сходимости;
- использование экспериментальных методик анализа факторов завышенности стандартных оценок обобщающей способности;
- использование свойств расслоения и связности в семействах алгоритмов вместо тривиального подсчёта числа различных алгоритмов в семействе;
- использование свойств метода обучения наряду со свойствами семейства алгоритмов;
- возможность получения точных оценок вероятности переобучения вместо стандартных асимптотических сильно завышенных оценок.
Результаты, выносимые на защиту
- Слабая вероятностная аксиоматика, основанная на единственном вероятностном предположении -- о независимости наблюдений в конечной выборке. Общая постановка задач эмпирического предсказания.
- VC-оценки вероятности переобучения, учитывающие степень некорректности метода обучения.
- Методика эмпирического измерения факторов завышенности VC-оценок вероятности переобучения.
- Метод получения точных оценок вероятности переобучения, основанный на выделении множеств порождающих и запрещающих объектов для каждого алгоритма в семействе.
- Рекуррентный алгоритм вычисления точных, верхних и нижних оценок вероятности переобучения.
- Блочный метод вычисления точных оценок вероятности переобучения.
- Точные оценки вероятности переобучения для ряда модельных семейств алгоритмов: слоя и интервала булева куба, монотонных и унимодальных цепочек, единичной окрестности.
- Оценка вероятности переобучения, учитывающая профиль расслоения и связности семейства алгоритмов.
- Точные оценки полного скользящего контроля для метода ближайшего соседа, выражающиеся через профиль компактности выборки.
- Верхние оценки полного скользящего контроля для семейства монотонных алгоритмов, выражающиеся через профиль монотонности выборки.
Полный текст
- Текст диссертации: (PDF, 3,07 МБ)
- Текст автореферата: (PDF, 320 КБ)
- Презентация доклада на защите (PDF, 1,76 МБ).