Метод покоординатного спуска

Материал из MachineLearning.

(Различия между версиями)

Перейти к: навигация, поиск

Текущая версия

Содержание

1 Введение
2 Метод покоординатного спуска
3 Числовые примеры
4 Рекомендации программисту
5 Заключение
6 Ссылки
7 Список литературы

Введение

Рассмотрим задачу поиска минимума функции $f(x): \mathbb{R}^n \to \mathbb{R}$ , записываемую в виде:

(1)

$f(x) \to \min_{x \in \mathbb{R}^n}$

В этой статье описан метод покоординатного спуска, решающий поставленную задачу. Также приведена теорема сходимости метода покоординатного спуска.

Метод покоординатного спуска

Алгоритм

Рис.1 Иллюстрация метода

Вход: функция $f: \mathbb{R}^n \to \mathbb{R}$

Выход: найденная точка оптимума $x$

Инициализация некоторым значением $x_0 \in \mathbb{R}^n$
повторять:
- для
  1. фиксируем значения всех переменных кроме $x_i$ , получая одномерную функцию $f(x_i)$
  2. проводим одномерную оптимизацию по переменной $x_i$ , любым методом одномерной оптимизации
  3. если выполен критерий останова (варианты описаны ниже), то возвращаем текущее значение $x=(x_1,\dots,x_n)$

Критерий останова

Критерии остановки процесса приближенного нахождения минимума могут быть основаны на различных соображениях. Некоторые из них:

$||x^{[k+1]}-x^{[k]}||\leq\eps$
$||f(x^{[k+1]})-f(x^{[k]})||\leq\eps$

Здесь $x^{[k]} \in \mathbb{R}^n$ - значение, полученное после $k$ -го шага оптимизации. $\eps$ - наперед заданное положительное число.

Сходимость метода

Рис.2

Легко убедится, что существуют функции, когда метод координатного спуска не приводит даже в локальный оптимум.

Пусть линии уровня образуют истинный овраг (рис.2), когда спуск по любой координате приводит на <<дно>> оврага, а любое движение по следующей координате (пунктирная линия) ведет на подъем. Никакой дальнейший спуск по координатам в данном случае невозможен, хотя минимум еще не достигнут.

Теорема о сходимости метода покоординатного спуска.

Для простоты рассмотрим функцию двух переменных $f(x,y)$ . Выберем некоторое начальное приближение $(x_0,y_0)$ и проведем линию уровня через эту точку. Пусть в области $G$ , ограниченной этой линией уровня, выполняются неравенства, означающий положительную определенность квадратичной формы:

$f_{xx}''\geq a>0,\; f_{yy}''\geq b>0,\; |f_{xy}''|\leq c,\; ab>c^2.$

Тогда спуск по координатам сходится к минимуму из данного начального приближения, причем линейно.

Числовые примеры

Для исследования сходимости метода покоординатного спуска была выбрана функция:

$f(x_1,x_2)=(x_1-1)^2+(x_2-1)^2-x_0*x_1$ .

Начальное приближение - точка (10,10). Использован критерий останова: $||f(x^{[k+1]})-f(x^{[k]})||\leq 10^{-5}$

Для решения одномерных задач оптимизации использован метод золотого сечения.

Метод получил точность 1e-8 за 7 итераций.

Отсюда можно сделать вывод, что метод координатного спуска сходится неплохо на примерах, для которых он применим.

Заключение

Метод координатного спуска является простым в реализации методом оптимизации. Главным недостатком метода является его ограниченная применимость.

Ссылки

Список литературы

А.А.Самарский, А.В.Гулин. Численные методы. Москва «Наука», 1989.
Н.С.Бахвалов, Н.П.Жидков, Г.М.Кобельков. Численные методы. Лаборатория Базовых Знаний, 2003.
Н.Н.Калиткин. Численные методы. Москва «Наука», 1978.

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%BF%D0%BE%D0%BA%D0%BE%D0%BE%D1%80%D0%B4%D0%B8%D0%BD%D0%B0%D1%82%D0%BD%D0%BE%D0%B3%D0%BE_%D1%81%D0%BF%D1%83%D1%81%D0%BA%D0%B0»

Категория: Учебные задачи

@@ Строка 1: / Строка 1: @@
-== Постановка задачи ==
+== Введение ==
 Рассмотрим задачу поиска минимума функции <tex>f(x): \mathbb{R}^n \to \mathbb{R} </tex>, записываемую в виде:
 {{eqno|1}}
 ::<tex>f(x) \to \min_{x \in \mathbb{R}^n}</tex>
-== Метод покоординатного спуска (Метод Гаусса-Зейделя) ==
+В этой статье описан метод покоординатного спуска, решающий поставленную задачу. Также приведена теорема сходимости метода покоординатного спуска.
+== Метод покоординатного спуска ==
 ===Алгоритм===
@@ Строка 18: / Строка 20: @@
 #*#     фиксируем значения всех переменных кроме <tex>x_i</tex>, получая одномерную функцию <tex>f(x_i)</tex>
 #*#     проводим одномерную оптимизацию по переменной <tex>x_i</tex>, любым методом одномерной оптимизации
-#*#     если выполен критерий останова, то возвращаем текущее значение <tex>x=(x_1,\dots,x_n)</tex>
+#*#     если выполен критерий останова (варианты описаны ниже), то возвращаем текущее значение <tex>x=(x_1,\dots,x_n)</tex>
 ===Критерий останова===
 Критерии остановки процесса приближенного нахождения минимума могут быть основаны на различных соображениях.
 Некоторые из них:
-# <tex>||x_{k+1}-x_{k}||\leq\eps</tex>
+# <tex>||x^{[k+1]}-x^{[k]}||\leq\eps</tex>
-# <tex>||f(x_{k+1})-f(x_{k})||\leq\eps</tex>
+# <tex>||f(x^{[k+1]})-f(x^{[k]})||\leq\eps</tex>
-Здечь <tex>x_k \in \mathbb{R}^n</tex> --- значение, полученное после <tex>k</tex>-го шага оптимизации.
+Здесь <tex>x^{[k]} \in \mathbb{R}^n</tex> - значение, полученное после <tex>k</tex>-го шага оптимизации.
+<tex>\eps</tex> - наперед заданное положительное число.
 ===Сходимость метода===
@@ Строка 37: / Строка 40: @@
 '''Теорема о сходимости метода покоординатного спуска.'''
-Для простоты рассмотрим функцию двух переменных <tex>f(x,y)</tex>. Выберем некоторое началное приближение <tex>(x_0,y_0)</tex> и проведем линию уровня через эту точку. Пусть в области <tex>G</tex>, ограниченной этой линией уровня, выполняются неравенства, означающий положительную определенность квадратичной формы:
+Для простоты рассмотрим функцию двух переменных <tex>f(x,y)</tex>. Выберем некоторое начальное приближение <tex>(x_0,y_0)</tex> и проведем линию уровня через эту точку. Пусть в области <tex>G</tex>, ограниченной этой линией уровня, выполняются неравенства, означающий положительную определенность квадратичной формы:
 ::<tex>f_{xx}''\geq a>0,\; f_{yy}''\geq b>0,\; |f_{xy}''|\leq c,\; ab>c^2.</tex>
 Тогда спуск по координатам сходится к минимуму из данного начального приближения, причем линейно.
 == Числовые примеры ==
+Для исследования сходимости метода покоординатного спуска была выбрана функция:
+::<tex>f(x_1,x_2)=(x_1-1)^2+(x_2-1)^2-x_0*x_1</tex>.
+Начальное приближение - точка (10,10). Использован критерий останова: <tex>||f(x^{[k+1]})-f(x^{[k]})||\leq 10^{-5}</tex>
+Для решения одномерных задач оптимизации использован [[Метод золотого сечения. Симметричные методы|метод золотого сечения]].
+Метод получил точность 1e-8 за 7 итераций.
+Отсюда можно сделать вывод, что метод координатного спуска сходится неплохо на примерах, для которых он применим.
 == Рекомендации программисту ==
+Возникающую одномерную задачу оптимизации можно решать любым методом одномерной оптимизации, например [[Метод золотого сечения. Симметричные методы|методом золотого сечения]].
 == Заключение ==
+Метод координатного спуска является простым в реализации методом оптимизации. Главным недостатком метода является его ограниченная применимость.
 == Ссылки ==
 * [[Практикум ММП ВМК, 4й курс, осень 2008|Практикум ММП ВМК, 4й курс, осень 2008]]
+* [[Media:CoordinateDescent.zip|  Код метода координатного спуска, ZIP [2Кб]]]
 == Список литературы ==
@@ Строка 52: / Строка 74: @@
 * ''Н.Н.Калиткин.''&nbsp; Численные методы. Москва «Наука», 1978.
-{{stub}}
 [[Категория:Учебные задачи]]

Метод покоординатного спуска

Материал из MachineLearning.

Текущая версия

Содержание

Введение

Метод покоординатного спуска

Алгоритм

Критерий останова

Сходимость метода

Числовые примеры

Рекомендации программисту

Заключение

Ссылки

Список литературы

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты