Метод Ньютона. Метод Стеффенсена

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Метод Ньютона)
(Метод Ньютона)
Строка 7: Строка 7:
Рассмотирим метод Ньютона для задачи
Рассмотирим метод Ньютона для задачи
-
<tex> J(u)-> \inf; u \inset U,</tex>
+
<tex> J(u)-> \inf; u \in U,</tex>
где <tex>J(u) _in C^2(U)</tex>, U - выпуклое замкнутое множество из E^n. Пусть <tex>u_0</tex>∈U - некоторое начальное приближение. Если известно k-е приближение <tex>u_k</tex>, то приращение функции J(u)∈ <tex>C^2(U)</tex> в точек <tex>u_k</tex> можно представить в виде
где <tex>J(u) _in C^2(U)</tex>, U - выпуклое замкнутое множество из E^n. Пусть <tex>u_0</tex>∈U - некоторое начальное приближение. Если известно k-е приближение <tex>u_k</tex>, то приращение функции J(u)∈ <tex>C^2(U)</tex> в точек <tex>u_k</tex> можно представить в виде
Строка 13: Строка 13:
Возьмем квадратичную часть этого приращения
Возьмем квадратичную часть этого приращения
-
 
+
{{eqno||2}}
<tex> J_k(u)=<J'(u_k),u-u_k>+1/2*<J''(u_k)(u-u_k),u-u_k> </tex>
<tex> J_k(u)=<J'(u_k),u-u_k>+1/2*<J''(u_k)(u-u_k),u-u_k> </tex>
Строка 30: Строка 30:
<tex> u_{k+1}\in U, J_k(u_{k+1})=\inf\limits_U J_k(u), k=0,1,\dots </tex>
<tex> u_{k+1}\in U, J_k(u_{k+1})=\inf\limits_U J_k(u), k=0,1,\dots </tex>
-
Таким образом получаем систему линейный уровнений
+
Таким образом получаем систему линейный уровнений, которую необходимо решать на каждой итерации.
 +
 
 +
<tex> J'_k(u_{k+1})=J'(u_k)+J''(u_k)(u_{k+1}-u_k)=0. </tex>

Версия 18:12, 23 ноября 2008

Постановка задачи

Общие понятния

Если минимизируемая функция дважд непрерывно дифференцируема и производные J'(u), J''(u) просто вычисляются, то можно применять методы минимизации второго порядка, которые используют квадратичную часть разложения функции в ряд Тейлора. Поскольку квадратичная часть разложения аппроксимирует функцию гораздо точнее, чем линейная, то естесвенно ожидать, что методв второго порядка сходятся быстрее, чем методы первого. Метод Ньютона, имеющий квадратичную скорость сходимости на классе сильно выпуклых функций. Говорят, что последовательность {u_k}сходитcz к u_* с линейной скоростью или со скоростью геометрической прогресси (со знаменателем q), если начиная с некоторго номера, выполняется неравенство |u_{k+1}-u_*|<q|u_k-u_*| (0<q<1); при выполнении неравенства |u_{k+1}-u_*|<q_k|u_k-u_*|, где {q_k}->0, говорят о сверхлинейной скорости сходимости последованояти {u_k} к u_*, а если здесь q_k=C|u_k-u_*|^{s-1}, т. е. |u_{k+1}-u_*|<C|u_k-u_*|^s, то говорят о скорости сходимсоти порядка s. При s=2, говорят о квадратичной скорости сходимости.

Метод Ньютона

Рассмотирим метод Ньютона для задачи  J(u)-> \inf; u \in U, где J(u) _in C^2(U), U - выпуклое замкнутое множество из E^n. Пусть u_0∈U - некоторое начальное приближение. Если известно k-е приближение u_k, то приращение функции J(u)∈ C^2(U) в точек u_k можно представить в виде

J(u)-J(u_k)=<J'(u_k),u-u_k>+1/2*<J''(u_k)(u-u_k),u-u_k>+o(|u-u_k|^2)

Возьмем квадратичную часть этого приращения

()

 J_k(u)=<J'(u_k),u-u_k>+1/2*<J''(u_k)(u-u_k),u-u_k>

и определим вспомогательное приближение u_k из условий

u_k \in U, J_k(u_k)=\inf_U J_k(u).

Следущее (k+1)-e приближение будем искать в виде

u_{k+1}=u_k+\alpha_k(\overline{u_k}-u_k), 0<\alpha_k<1.

В зависимости от способа выбора величины \alpha_k в (4) можно получить различные варианты метода Ньютона. Укажем несколько наиболее употребительных способов выбора \alpha_k. ===1) \alpha_k=1 Тогда u_{k+1}=\overline{u_k} (k=0,1,\dots), т. е. условие (3) сразу определяет следующее (k+1)-е приближение. Иначе говоря,

 u_{k+1}\in U, J_k(u_{k+1})=\inf\limits_U J_k(u), k=0,1,\dots

Таким образом получаем систему линейный уровнений, которую необходимо решать на каждой итерации.

 J'_k(u_{k+1})=J'(u_k)+J''(u_k)(u_{k+1}-u_k)=0.

Личные инструменты