Формула Надарая-Ватсона
Материал из MachineLearning.
Строка 14: | Строка 14: | ||
==Обоснование формулы== | ==Обоснование формулы== | ||
- | Строгим обоснованием формулы в одномерном случае служит следующая теорема : <br /> | + | Строгим обоснованием формулы в одномерном случае с метрикой <tex>\rho(x,x_i) = |x - x_i|</tex> служит следующая теорема : <br /> |
'''Теорема''' Пусть выполнены условия : <br /> | '''Теорема''' Пусть выполнены условия : <br /> | ||
1) выборка <tex>$X^l = (x_i,y_i)^l_{i=1}$</tex> получена случайно и независимо из распределения <tex>p(x,y)</tex> <br /> | 1) выборка <tex>$X^l = (x_i,y_i)^l_{i=1}$</tex> получена случайно и независимо из распределения <tex>p(x,y)</tex> <br /> |
Версия 21:25, 6 января 2010
Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |
Формула Надарая-Ватсона используется для решения задачи непараметрического восстановления регрессии.
Содержание |
Постановка задачи
Пусть задано пространство объектов и множество возможных ответов . Существует неизвестная зависимость , значения которой известны только на объектах обучающией выборки . Требуется построить алгоритм , аппроксимирующий неизвестную зависимость . Предполагается, что на множестве задана метрика .
Формула Надарая-Ватсона
Для вычисления при , воспользуемся методом наименьших квадратов:
, где - это вес i-ого объекта.
Веса разумно задать так, чтобы они убывали по мере увеличения расстояния . Для этого можно ввести невозрастающую, гладкую, ограниченную функцию , называемую ядром, и представить в следующем виде :
, где — ширина окна.
Приравняв нулю производную , и, выразив ,получаем формулу Надарая-Ватсона :
Обоснование формулы
Строгим обоснованием формулы в одномерном случае с метрикой служит следующая теорема :
Теорема Пусть выполнены условия :
1) выборка получена случайно и независимо из распределения
2) ядро удовлетворяет ограничениям и
3) восстанавливаемая зависимость, определяемая плотностью , удавлетворяет при любом ограничению
4) последовательность такова, что и
Тогда имеет место сходимость по вероятности : в любой точке , в которой и непрерывны и .
Литература
1) К. В. Воронцов, Лекции по алгоритмам восстановления регрессии, 2009
2) Хардле В. Прикладная непараметрическая регрессия. - М.: Мир, 1993.