Метод Ньютона. Проблема области сходимости. Метод парабол. Совмещение методов Ньютона и парабол

Материал из MachineLearning.

Версия от 18:59, 25 ноября 2008; Lr2k (Обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)

Перейти к: навигация, поиск

Содержание

1 Постановка задачи одномерной оптимизации
2 Метод Ньютона
- 2.1 Ограничения
- 2.2 Проблема области сходимости
3 Метод парабол
4 Численный пример
5 Литература
6 Смотри также

Постановка задачи одномерной оптимизации

Задача одномерной оптимизации определяется следующим образом:

Допустимое множество — множество $\mathbb{X} \subseteq \texbb{R}$ ;
Целевую функцию — отображение $f:\;\mathbb{X}\to\mathbb{R}$ ;
Критерий поиска (max или min).

Тогда решить задачу $f(x)\to \min_{x\in\mathrm{X}}$ означает одно из:

Показать, что $\mathbb{X}=\not\bigcirc$ .
Показать, что целевая функция $f(x)$ не ограничена.
Найти $x^*\in\mathbb{X}:\;f(x^*)=\min_{x\in\mathbb{X}}f(\vec{x})$ .
Если $\not\exists x^*$ , то найти $\inf_{x\in\mathbb{X}}f(x)$ .

Если минимизируемая функция не является выпуклой, то часто ограничиваются поиском локальных минимумов и максимумов: точек $x_0$ таких, что всюду в некоторой их окрестности $f(x)\ge f(x_0)$ для минимума и $f(x)\le f(x_0)$ для максимума.

Если допустимое множество $\mathbb{X}=\mathbb{R}$ , то такая задача называется задачей безусловной оптимизации, в противном случае — задачей условной оптимизации.

Метод Ньютона

Это итерационный численный метод нахождения корня (нуля) заданной функции. Метод был впервые предложен английским физиком, математиком и астрономом Исааком Ньютоном (1643—1727), под именем которого и обрёл свою известность. Поиск решения осуществляется путём построения последовательных приближений и основан на принципах простой итерации. Метод обладает квадратичной сходимостью. В случае решения задач оптимизации предполагается, что функция $f(x)$ дважды непрерывно дифференцируема. Отыскание минимума функции $f(x)$ производится при помощи отыскания стационарной точки, т.е. точки $x^*$ , удовлетворяющей уравнению $f'(x)=0$ , которое решается методом Ньютона.

Если $x^k$ – точка, полученная на k-м шаге, то функция $f'(x)$ аппроксимируется своим уравнением касательной:

$y = f'(x^k) + (x - x^k)f''(x^k)$

а точка $x^{k+1}$ выбирается как пересечение этой прямой с осью $Ox$ , т.е.

$x^{k+1} = x^k - \frac{f'(x^k)}{f''(x^k)}$ .

Неудобство этого метода состоит в необходимости вычисления в каждой точке первой и второй производных. Значит, он применим лишь тогда, когда функция $f(x)$ имеет достаточно простую аналитическую форму, чтобы производные могли быть вычислены в явном виде вручную. Действительно, всякий раз, когда решается новая задача, необходимо выбрать две специфические подпрограммы (функции) вычисления производных $f'(x)$ и $f''(x)$ , что не позволяет построить общие алгоритмы, т.е. применимые к функции любого типа.

Когда начальная точка итераций $x_0$ достаточно близка к искомому минимуму, скорость сходимости метода Ньютона в общем случае квадратическая. Однако, глобальная сходимость метода Ньютона, вообще говоря, не гарантируется.

Хороший способ гарантировать глобальную сходимость этого метода состоит в комбинировании его с другим методом для быстрого получения хорошей аппроксимации искомого оптимума. Тогда несколько итераций метода Ньютона, с этой точкой в качестве исходной, достаточны для получения превосходной точности.

Ограничения

Пускай задано уравнение $f(x)=0\!$ , где $f(x):\;\mathbb{X} \to \mathbb{R}\!$ и надо найти его решение.

Ниже приведена формулировка основной теоремы, которая позволяет дать чёткие условия применимости. Теорема Канторовича.

Если существуют такие константы $A,B,C\!$ , что:

$\frac{1}{|f'(x)|}<A\!$ на $[a,\;b]\!$ , то есть $f'(x)\!$ существует и не равна нулю;
$\left|\frac{f(x)}{f'(x)}\right|<B\!$ на $[a,\;b]\!$ , то есть $f(x)\!$ ограничена;
$\exist f''(x)\!$ на $[a,\;b]\!$ , и $|f''(x)|\leq C \leq \frac{1}{2AB}\!$ ;

Причём длина рассматриваемого отрезка $|a-b|<\frac{1}{AB}\left(1- \sqrt{1-2ABC}\right)\!$ . Тогда справедливы следующие утверждения:

на $[a,\;b]\!$ существует корень $x^*$ уравнения $f(x)=0:\quad\exist x^*\in[a,\;b]: f(x^*)=0\!$ ;
если $x_0=\frac{a+b}{2}\!$ , то итерационная последовательность сходится к этому корню: $\left\{ x_{n+1}=x_n-\frac{f(x_n)}{f'(x_n)}\right\}\to x^*\!$ ;
погрешность может быть оценена по формуле $|x^*-x_n|\leq\frac{B}{2^{n-1}}(2ABC)^{2^{n-1}}\!$ .

Из последнего из утверждений теоремы в частности следует квадратичная сходимость метода:

$|x^*-x_n|\leq\frac{B}{2^{n-1}}(2ABC)^{2^{n-1}}=\frac{1}{2}\frac{B}{2^{n-2}}\left((2ABC)^{2^{n-2}}\right)^2=\alpha |x^*-x_{n-1}|^2\!$

Тогда ограничения на исходную функцию $f(x)\!$ будут выглядеть так:

функция должна быть ограничена;
функция должна быть гладкой, дважды дифференцируемой;
её первая производная $f'(x)$ равномерно отделена от нуля;
её вторая производная $f''(x)\!$ должна быть равномерно ограничена.

В случае решения задачи оптимизации под функцией понимаем ее производную.

Проблема области сходимости

Запишем итерационный процесс:

$x^{k+1} = x^k - \frac{f'(x^k)}{f''(x^k)}$ .

Известно, что условием сходимости этого процесса будет неравенство

$|S'(x)| \le q < 1$ ,

где $S(x) = x^k - \frac{f'(x^k)}{f''(x^k)}$ , отсюда получем условие сходимости:

$|\frac{f'(x)f'''(x)}{(f'(x))^2}| \le q < 1$ .

В силу того что мы ищем корень уравнения $f'(x) = 0$ , существует такая окрестность, где $|S'(x)| \le q < 1$ , но в общем случае эта область будет мала, то есть нужно подбирать начальное приближение достаточно близко расположенным к корню.

Теорма о сходимости метода Ньютона Пусть $x^*$ - простой вещественный корень уравнения $f(x) = 0$ , а функция $f(x)$ - дважды дифференцируема в некоторой окрестности $U_r(x^*)$ , причем первая произодная нигде не обращается в нуль.

Тогда, следуя обозначениям

$0 < m_1 = \inf_{x\in U_r(x^*)}|f'(x)|, M_2 = \sup_{x\in U_r(x^*)}|f''(x)|$ ,

При выборе начального приближения $x^0$ из той же окрестности $U_r(x^*)$ такого, что

$\frac{M_2|x^0 - x^*|}{2m_1} = q < 1$ ,

итерационная последовательность

$x^{k+1} = x^k - \frac{f(x^k)}{f'(x^k)}, k = 0,1, \dots$

будет сходиться к $x^*$ , причем для погрешности на k-м шаге буддет справедлива оценка:

$|x^k - x^*| \le q^{2^k - 1}|x^0 - x^*|$ .

Метод парабол

Относительно метода Ньютона этот метод обладает тем преимуществом, что он не требует вычисления производных функции $f(x)$ . Однако, его сходимость может быть гарантирована лишь для достаточно регулярных функций (непрерывных и много раз дифференцируемых).

В этом методе вычисляется значение функции сразу в трех близлежащих точках $x_0 - h$ , $x_0$ , $x_0 + h$ , где h – малое число. Через эти три точки проводится интерполяционная парабола:

$y = ax^2 + bx + c$ .

Минимум параболы достигается при $y = 2ax + b = 0$ , т.е. при $x^* = \frac{-b}{2a}$ . Для трех точек получаем систему трех линейных уравнений для коэффициентов a, b, c. Находим a и b и тогда:

$x^{k+1} = x^k - 0.5h\frac{f(x^k + h) - f(x^k - h)}{f(x^k + h) - 2f(x^k) + f(x^k - h)}$ .

Численный пример

Сравним работу методов Ньютона и парабол на примере много экстремальной функции $x^3 + 10sin(5x)$ при одинаковом начальном приближении:

номер итерации	$x_n^k$ полученное методом Ньютона	$x_p^k$ полученное методом парабол	$f'(x_n^k)$	$f'(x_p^k)$
10	x=2.78; y=7.55;	x=2.39; y=6.39;	x=1.73; y=6.87;	6.725
20	x=2.63; y=6.96;	x=2.70; y=7.29;	x=2.64; y=6.88;	2.769
30	x=2.24; y=4.94;	x=2.35; y=5.50;	x=2.42; y=5.86;	1.823
40	x=1.90; y=3.58;	x=1.83; y=3.38;	x=1.97; y=3.89;	0.821
50	x=1.51; y=2.28;	x=1.53; y=2.36;	x=1.57; y=2.47;	0.273
60	x=1.20; y=1.42;	x=1.23; y=1.51;	x=1.27; y=1.61;	0.050	0.079
70	x=0.99; y=0.97;	x=1.01; y=1.02;	x=0.96; y=0.93;	0.000

Литература

А.А.Самарский, А.В.Гулин. Численные методы М.: Наука, 1989.
А.А.Самарский. Введение в численные методы М.: Наука, 1982.
Н.В.Соснин. Численные методы. Конспект лекций (сост. Д.В.Ховратович, Е.А.Попов).
М.М.Потапов. Методы оптимизаций. Конспект лекций (сост. М.Л.Буряков).
Е.А.Волков. Численные методы. — М.: Физматлит, 2003.

Смотри также

Практикум ММП ВМК, 4й курс, осень 2008

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%9D%D1%8C%D1%8E%D1%82%D0%BE%D0%BD%D0%B0._%D0%9F%D1%80%D0%BE%D0%B1%D0%BB%D0%B5%D0%BC%D0%B0_%D0%BE%D0%B1%D0%BB%D0%B0%D1%81%D1%82%D0%B8_%D1%81%D1%85%D0%BE%D0%B4%D0%B8%D0%BC%D0%BE%D1%81%D1%82%D0%B8._%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%BF%D0%B0%D1%80%D0%B0%D0%B1%D0%BE%D0%BB._%D0%A1%D0%BE%D0%B2%D0%BC%D0%B5%D1%89%D0%B5%D0%BD%D0%B8%D0%B5_%D0%BC%D0%B5%D1%82%D0%BE%D0%B4%D0%BE%D0%B2_%D0%9D%D1%8C%D1%8E%D1%82%D0%BE%D0%BD%D0%B0_%D0%B8_%D0%BF%D0%B0%D1%80%D0%B0%D0%B1%D0%BE%D0%BB»

Категория: Учебные задачи

Метод Ньютона. Проблема области сходимости. Метод парабол. Совмещение методов Ньютона и парабол

Материал из MachineLearning.

Содержание

Постановка задачи одномерной оптимизации

Метод Ньютона

Ограничения

Проблема области сходимости

Метод парабол

Численный пример

Литература

Смотри также

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты