Однослойные сети RBF для решения задач регрессии (пример)

Материал из MachineLearning.

(Различия между версиями)

Версия 11:26, 7 июня 2010

Радиальная функция — это функция $f(x)$ , зависящая только от расстояния между x и фиксированной точкой пространства X. В данной работе используются гауссианы $p_j(x) = N(x; \mu _j ,\Sigma _j)$ , которые можно представить в виде $p_j(x) = N_j exp(-\frac{1}{2} \rho _j (x, \mu _j)$
где $N_j = (2\pi)^ {-\frac{n}{2}}(\sigma _{j1}, \dots ,\sigma _{jn})^{-1}$ — нормировочный множитель,
$\rho _j(x, x')$ — взвешенная евклидова метрика в n-мерном пространстве X:
$~\rho (x, x') = \sum ^n _{d = 1} \sigma ^{-2} _{jd} |\xi _d - \xi _d '|$ ,
$x = (\xi _1, . . . ,\xi _n), x' = (\xi _1 ', . . . , \xi _n')$ .
Сеть радиальных базисных функций - нейронная сеть прямого распространения сигнала, которая содержит промежуточный (скрытый) слой радиально симметричных нейронов. Такой нейрон преобразовывает расстояние от данного входного вектора до соответствующего ему "центра" по некоторому нелинейному закону - с помощью радиальной функции. В данной статье мы рассмотрим применение этой нейронной сети к решению задачи регрессии с помощью восстановления смесей распределений.

Содержание

1 Постановка задачи
2 Описание алгоритма
- 2.1 Разделение смеси рапределений
- 2.2 Восстановление регрессии

Постановка задачи

Задана выборка — множество $\{{x}_1,\ldots,{x}_N|x\in\R^M\}$ значений свободных переменных и множество $\{y_1,\ldots, y_N| y\in\R\}$ соответствующих им значений зависимой переменной. Предполагается, что на множестве объектов задана плотность распределения $p(x)$ , представимая в виде смеси распределений - $k$ гауссиан с параметрами $\mu$ и $\Sigma$ : $p(x) = \sum_{i=1}^k w_jp_j(x) = \sum_{i=1}^k w_jN(x;\mu_j,\Sigma_j).$
$N(x;\mu_j,\Sigma_j) = \frac{1}{\sqrt{(2\pi)^ndet\Sigma_j}}e^{-\frac{1}{2}(x-\mu_j)\Sigma_j^{-1}(x-\mu_j)^{T}}$
Требуется решить задачу регрессии с помощью однослойной сети RBF, параметрами которой являются
$k, w_j, \theta_j=(\mu_j,\Sigma_j), y(\mu_j)=Y_j, j=1\dots k$ , где
$k$ - число компонент смеси,
$w_j$ - веса компонент,
$\theta_j=(\mu_j,\Sigma_j)$ - центры и дисперсия компонент,
$y(\mu_j)=Y_j$ - значения зависимой переменной в центрах компонент.
Смесь распределений требуется восстановить с помощью EM-алгоритма с добавлением компонент.
Таким образом решается задача регрессии с помощью однослойной сети RBF, обучаемой с помощью EM-алгоритма с добавлением компонент.

Описание алгоритма

Разделение смеси рапределений

Настройка параметров RBF-сети происходит с помощью EM-алгоритма с добавлением компонент. Идея EM-алгоритма заключается во введении вспомогательного вектора скрытых переменных $G$ . С одной стороны, он может быть вычислен, если известны значения вектора параметров $\Theta$ , с другой стороны, поиск максимума правдоподобия сильно упрощается, если известны значения скрытых переменных. EM-алгоритм состоит из итерационного повторения двух шагов. На E-шаге вычисляется ожидаемое значение (expectation) вектора скрытых переменных $G$ по текущему приближению вектора параметров $\Theta$ . На М-шаге решается задача максимизации правдоподобия (maximization) и находится следующее приближение вектора $\Theta$ по текущим значениям векторов $G$ и $\Theta$ .

Если число компонент смеси заранее неизвестно, то применяется EM-алгоритм с последовательным добавлением компонент. Его идея заключается в том, что если данные описаны смесью $k$ компонент, то можно добавить в смесь $(k+1)$ -ю компоненту, построенную на элементах, описанных хуже всего (имеющих минимальное правдоподобие). Далее на смеси из $(k+1)$ -ой компоненты запускается EM-алгоритм.

Для более подробного описания см.

Восстановление регрессии

Значения зависимой переменной в центрах компонент
$Y_j=y(\mu_j)=\frac{\sum_{i=1}^N y_i*p_j(x_i)}{\sum_{i=1}^N p_j(x_i)}$

Данная статья является непроверенным учебным заданием.

Студент: Участник:Кононенко Даниил

Преподаватель: Участник:В.В.Стрижов

Срок: 28 мая 2010

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%9E%D0%B4%D0%BD%D0%BE%D1%81%D0%BB%D0%BE%D0%B9%D0%BD%D1%8B%D0%B5_%D1%81%D0%B5%D1%82%D0%B8_RBF_%D0%B4%D0%BB%D1%8F_%D1%80%D0%B5%D1%88%D0%B5%D0%BD%D0%B8%D1%8F_%D0%B7%D0%B0%D0%B4%D0%B0%D1%87_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%B8_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29»

Категории: Непроверенные учебные задания | Нейронные сети | Практика и вычислительные эксперименты

@@ Строка 1: / Строка 1: @@
 '''Радиальная функция''' — это функция <tex>f(x)</tex>, зависящая только от расстояния между x и фиксированной точкой пространства X.
-В данной работе используются гауссианы <tex>p_j(x) = N(x; \mu _j ,\Sigma _j)</tex>, которые можно представить в виде <tex>p_j(x) = N_j exp(-1/2 \rho  _j (x, \mu _j)</tex>  <br />
+В данной работе используются гауссианы <tex>p_j(x) = N(x; \mu _j ,\Sigma _j)</tex>, которые можно представить в виде <tex>p_j(x) = N_j exp(-\frac{1}{2} \rho  _j (x, \mu _j)</tex>  <br />
 где <tex>N_j = (2\pi)^ {-\frac{n}{2}}(\sigma _{j1}, \dots ,\sigma _{jn})^{-1}</tex> — нормировочный множитель,<br />
 <tex>\rho _j(x, x')</tex> — взвешенная евклидова метрика в n-мерном пространстве X:<br />
@@ Строка 39: / Строка 39: @@
 Значения зависимой переменной в центрах компонент <br />
-<tex>Y_j=y(\mu_j)=</tex>
+<tex>Y_j=y(\mu_j)=\frac{\sum_{i=1}^N y_i*p_j(x_i)}{\sum_{i=1}^N p_j(x_i)}</tex>

Однослойные сети RBF для решения задач регрессии (пример)

Материал из MachineLearning.

Версия 11:26, 7 июня 2010

Содержание

Постановка задачи

Описание алгоритма

Разделение смеси рапределений

Восстановление регрессии

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты