Прореживание двухслойной нейронной сети (пример)

Материал из MachineLearning.

(Различия между версиями)

Версия 09:17, 14 апреля 2010

Прореживание двухслойной нейронной сети (optimal brain damage) - метод упрощения структуры нейронной сети. Идея прореживания состоит в том, что из сети удаляются параметры, оказывающие малое влияние на ошибку аппроксимации. Таким образом, модель упрощается, а ошибка аппроксимации не возрастает значительно.

Постановка задачи

Задана обучающая выборка $X^l, Y^l$ , где $x = (x^1, ..., x^n)$ ∈ $X^l;$ $x^i, i >= 1$ - признаковое описание объекта. Значения признаков $x^i$ поступают на вход первому слою сети с весовой матрицей $W_1$ , выходы первого слоя поступают на вход второму с весовой матрицей $W_2$ . Функции активации на обоих слоях - сигмоидальные: $\phi(z) = 1 / (1 + e^{-z})$ . На выходе второго слоя вычисляется вектор-функция $\bf{F} = (F_1(x),...,F_P(x))$ , где P - количество нейронов на втором слое. Параметры сети (матрицы $W_1$ и $W_2$ ) настраиваются алгоритмом обратного распространения (back propagation). Из полученной сети требуется устранить параметры, которые незначительно влияют на ошибку аппроксимации. Для этого необходимо посчитать матрицу Гессе $H = \frac{\partial^2 \bf{E}_{av}(\bf{w})}{ \partial \bf{w}^2}$ , где $\bf {w}$ - вектор весов, $\bf{E}_{av}(\bf{w}) = \frac{1}{2N} \sum_{n = 1}^N \sum_{p = 1}^P(F_p(n) - Y_p(n))^2$ - функция стоимости. Из сети удаляются параметры, соответствующие наименьшей степени выпуклости $S_i = \frac{w_i^2}{2 (\bf{H}^{-1})_{i,i}}$ .

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%9F%D1%80%D0%BE%D1%80%D0%B5%D0%B6%D0%B8%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%B4%D0%B2%D1%83%D1%85%D1%81%D0%BB%D0%BE%D0%B9%D0%BD%D0%BE%D0%B9_%D0%BD%D0%B5%D0%B9%D1%80%D0%BE%D0%BD%D0%BD%D0%BE%D0%B9_%D1%81%D0%B5%D1%82%D0%B8_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29»

Версия 08:05, 14 апреля 2010 (править) Mikethehuman (Обсуждение \| вклад) (Новая: '''Прореживание двухслойной нейронной сети '''(optimal brain damage) - метод упрощения структуры нейронной сети. ...) ← К предыдущему изменению		Версия 09:17, 14 апреля 2010 (править) (отменить) Mikethehuman (Обсуждение \| вклад) (→Постановка задачи) К следующему изменению →
Строка 3:		Строка 3:

	== Постановка задачи ==		== Постановка задачи ==
-	Задана обучающая выборка <tex>X^l, Y^l</tex>, где <tex>x = (x^1, ..., x^n) </tex>∈<tex> X;</tex> <tex> x^i, i >= 1</tex> - признаковое описание объекта. Значения признаков <tex>x^i</tex> поступают на вход первому слою сети с весовой матрицей <tex>W_1</tex>, выходы первого слоя поступают на вход второму с весовой матрицей <tex>W_2</tex>. Функции активации на обоих слоях - сигмоидальные: <tex>\phi(z) = 1 / (1 + e^{-z})</tex>.{{~~UnderConstruction\|[[Участник:Mikethehuman\|Mikethehuman]] 12:05~~, ~~14 апреля 2010~~ (~~MSD~~)}}	+	Задана обучающая выборка <tex>X^l, Y^l</tex>, где <tex>x = (x^1, ..., x^n) </tex>∈<tex> X^l;</tex> <tex> x^i, i >= 1</tex> - признаковое описание объекта. Значения признаков <tex>x^i</tex> поступают на вход первому слою сети с весовой матрицей <tex>W_1</tex>, выходы первого слоя поступают на вход второму с весовой матрицей <tex>W_2</tex>. Функции активации на обоих слоях - сигмоидальные: <tex>\phi(z) = 1 / (1 + e^{-z})</tex>. На выходе второго слоя вычисляется вектор-функция <tex>\bf{F} = (F_1(x),...,F_P(x))</tex>, где P - количество нейронов на втором слое. Параметры сети (матрицы <tex>W_1</tex> и <tex>W_2</tex>) настраиваются алгоритмом обратного распространения (back propagation). Из полученной сети требуется устранить параметры, которые незначительно влияют на ошибку аппроксимации. Для этого необходимо посчитать матрицу Гессе <tex>H = \frac{\partial^2 \bf{E}_{av}(\bf{w})}{ \partial \bf{w}^2}</tex>, где <tex>\bf {w}</tex> - вектор весов, <tex>\bf{E}_{av}(\bf{w}) = \frac{1}{2N} \sum_{n = 1}^N \sum_{p = 1}^P(F_p(n) - Y_p(n))^2</tex> - функция стоимости. Из сети удаляются параметры, соответствующие наименьшей степени выпуклости <tex>S_i = \frac{w_i^2}{2 (\bf{H}^{-1})_{i,i}}</tex>.

Прореживание двухслойной нейронной сети (пример)

Материал из MachineLearning.

Версия 09:17, 14 апреля 2010

Постановка задачи

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты