Формула Надарая-Ватсона
Материал из MachineLearning.
(3 промежуточные версии не показаны) | |||
Строка 1: | Строка 1: | ||
- | |||
- | |||
'''Формула Надарая-Ватсона''' используется для решения задачи непараметрического [http://www.machinelearning.ru/wiki/index.php?title=%D0%A0%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%BE%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7 восстановления регрессии]. | '''Формула Надарая-Ватсона''' используется для решения задачи непараметрического [http://www.machinelearning.ru/wiki/index.php?title=%D0%A0%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%BE%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7 восстановления регрессии]. | ||
== Постановка задачи == | == Постановка задачи == | ||
Строка 14: | Строка 12: | ||
==Обоснование формулы== | ==Обоснование формулы== | ||
- | Строгим обоснованием формулы в одномерном случае служит следующая теорема : <br /> | + | Строгим обоснованием формулы в одномерном случае с метрикой <tex>\rho(x,x_i) = |x - x_i|</tex> служит следующая теорема : <br /> |
'''Теорема''' Пусть выполнены условия : <br /> | '''Теорема''' Пусть выполнены условия : <br /> | ||
1) выборка <tex>$X^l = (x_i,y_i)^l_{i=1}$</tex> получена случайно и независимо из распределения <tex>p(x,y)</tex> <br /> | 1) выборка <tex>$X^l = (x_i,y_i)^l_{i=1}$</tex> получена случайно и независимо из распределения <tex>p(x,y)</tex> <br /> | ||
Строка 27: | Строка 25: | ||
2) Хардле В. Прикладная непараметрическая регрессия. - М.: Мир, 1993. <br /> | 2) Хардле В. Прикладная непараметрическая регрессия. - М.: Мир, 1993. <br /> | ||
- | [[Категория: | + | [[Категория:Непараметрическая регрессия]] |
Текущая версия
Формула Надарая-Ватсона используется для решения задачи непараметрического восстановления регрессии.
Содержание |
Постановка задачи
Пусть задано пространство объектов и множество возможных ответов . Существует неизвестная зависимость , значения которой известны только на объектах обучающией выборки . Требуется построить алгоритм , аппроксимирующий неизвестную зависимость . Предполагается, что на множестве задана метрика .
Формула Надарая-Ватсона
Для вычисления при , воспользуемся методом наименьших квадратов:
, где - это вес i-ого объекта.
Веса разумно задать так, чтобы они убывали по мере увеличения расстояния . Для этого можно ввести невозрастающую, гладкую, ограниченную функцию , называемую ядром, и представить в следующем виде :
, где — ширина окна.
Приравняв нулю производную , и, выразив ,получаем формулу Надарая-Ватсона :
Обоснование формулы
Строгим обоснованием формулы в одномерном случае с метрикой служит следующая теорема :
Теорема Пусть выполнены условия :
1) выборка получена случайно и независимо из распределения
2) ядро удовлетворяет ограничениям и
3) восстанавливаемая зависимость, определяемая плотностью , удавлетворяет при любом ограничению
4) последовательность такова, что и
Тогда имеет место сходимость по вероятности : в любой точке , в которой и непрерывны и .
Литература
1) К. В. Воронцов, Лекции по алгоритмам восстановления регрессии, 2009
2) Хардле В. Прикладная непараметрическая регрессия. - М.: Мир, 1993.