Алгоритм Trust-Region
Материал из MachineLearning.
(Содержимое страницы заменено на «Prak2.zip») |
|||
(7 промежуточных версий не показаны.) | |||
Строка 1: | Строка 1: | ||
- | [[ | + | ==Введение== |
+ | Рассмотрим здачу минимизации<br> | ||
+ | <tex>\min_x f(x)</tex> <tex>x \in R^n</tex><br> | ||
+ | ==Метод решения задачи== | ||
+ | Алгоритм Trust-Region основан на построение модельной функции <tex>m_k</tex>, которая приближает исходную в некоторой окрестности текущей точки <tex>x_k</tex>. При этом функция <tex>m_k</tex> может плохо приближать f в других точках, поэтому мы ограничиваен минимизацию этой некоторой окрестностью точки <tex>x_k</tex>. Другими словами, решается здача:<br> | ||
+ | <tex>\min_p m_k(x_k + p)</tex>, где <tex>x_k + p</tex> лежит внутри доверельной окрестности <br> | ||
+ | Обычно, доверительная окрестность - шар радиуса <tex>||p||_2 < \Delta</tex>. В качесте модели функции <tex>m_k</tex> обычно берется квадратичная: <br> | ||
+ | <tex>m_k (p) = f_k + p^T\nabla f_k + \frac12p^TH_kp</tex><br> | ||
+ | - разложение функции f по формуле Тейлора до второго слааемого.<br> | ||
+ | Итак, на каждом шаге решается подзадача:<br> | ||
+ | <tex>m_k (p) = f_k + p^T\nabla f_k + \frac12p^TH_kp</tex> s.t.<tex>||p||_2 < \Delta_k</tex><br> | ||
+ | Первая проблема, которая возникает, это определение радиуса доверительного интервала. Мы выбираем этот радиус, исходя из модели функции <tex>m_k</tex> и функции f на предыдущий итерациях. Определим соотношение<br> | ||
+ | <tex>\rho_k = \frac{f(x_k) - f(x_k + p_k)}{m_k(0) - m_k(p_k)}</tex><br> | ||
+ | ==Пример== | ||
+ | ==Рекомендации программисту== | ||
+ | ==Заключение== | ||
+ | ==Литература== | ||
+ | == Смотри также == | ||
+ | * [[Практикум ММП ВМК, 4й курс, осень 2008]] | ||
+ | {{stub}} | ||
+ | |||
+ | [[Категория:Учебные задачи]] |
Текущая версия
Содержание |
Введение
Рассмотрим здачу минимизации
Метод решения задачи
Алгоритм Trust-Region основан на построение модельной функции , которая приближает исходную в некоторой окрестности текущей точки . При этом функция может плохо приближать f в других точках, поэтому мы ограничиваен минимизацию этой некоторой окрестностью точки . Другими словами, решается здача:
, где лежит внутри доверельной окрестности
Обычно, доверительная окрестность - шар радиуса . В качесте модели функции обычно берется квадратичная:
- разложение функции f по формуле Тейлора до второго слааемого.
Итак, на каждом шаге решается подзадача:
s.t.
Первая проблема, которая возникает, это определение радиуса доверительного интервала. Мы выбираем этот радиус, исходя из модели функции и функции f на предыдущий итерациях. Определим соотношение