Обсуждение:Методы оптимизации в машинном обучении (курс лекций)/2012/Задание 1

Материал из MachineLearning.

(Различия между версиями)

Версия 16:06, 11 октября 2012

Какой критерий сходимости используют в методе парабол? Когда я выбираю тройки чисел, такие чтобы в центральной значение функции было минимально, у меня часто оказывается ситуация, когда один из краёв отрезка долго не меняется. При этом длина интервала между крайними точками долго остаётся слишком грубой оценкой, потом наконец выбирается другой край, и длина резко падает, например до 1e-8, что сильно точнее того что мы хотим. При этом остановиться, получив точность 1e-5, можно было сильно раньше. Shapovalov 14:51, 9 октября 2012 (MSD)
Критерий сходимости в методе парабол такой же, как и в других методах одномерной оптимизации: когда текущий интервал поиска решения сокращается до заданной длины. Действительно, в некоторых случаях в методе парабол интервал в итерациях сокращается очень слабо. Решать эту проблему можно различными модификациями метода парабол, например, использованием схемы Брента. В ней, в частности, отклоняются параболические точки, которые приводят к слишком маленьким сокращениям интервала поиска решения, и вместо них используется золотое сечение или деление отрезка пополам. В рамках задания не требуется модифицировать метод парабол на все случаи жизни. Необходимо лишь удостовериться в различным проблемах, связанных с его использованием на практике. При этом реализация схемы Брента должна справляться со всеми сложностями в оптимизации. — Д.А. Кропотов 22:11, 10 октября 2012 (MSD)

Кажется, в конспекте опечатка в псевдокоде Брента: в методе золотого сечения «если x < (c − a)/2 то» — похоже, должно быть среднее арифметическое. Shapovalov 16:08, 11 октября 2012 (MSD)

Ещё одна вещь мне помогла избавиться от нескольких лишних итераций трисекции перед самой сходимостью в методе Брента: если $u$ находится в $\eps$ -окрестности границы интервала, то не запускаем трисекцию сразу же, а двигаем $u$ в допустимую зону и пытаемся идти по параболическому приближению. В противном случае, если реальная точка минимума оказывается на границе интервала, то приходится зазря сужать интервал трисекциями. Такой вариант используется в “Numerical recipes”. Shapovalov 20:05, 11 октября 2012 (MSD)

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%9E%D0%B1%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5:%D0%9C%D0%B5%D1%82%D0%BE%D0%B4%D1%8B_%D0%BE%D0%BF%D1%82%D0%B8%D0%BC%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D0%B8_%D0%B2_%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%BC_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B8_%28%D0%BA%D1%83%D1%80%D1%81_%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9%29/2012/%D0%97%D0%B0%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_1»

Версия 16:05, 11 октября 2012 (править) Shapovalov (Обсуждение \| вклад) ← К предыдущему изменению		Версия 16:06, 11 октября 2012 (править) (отменить) Shapovalov (Обсуждение \| вклад) К следующему изменению →
Строка 4:		Строка 4:
	Кажется, в конспекте опечатка в псевдокоде Брента: в методе золотого сечения «если x < (c − a)/2 то» — похоже, должно быть среднее арифметическое. [[Участник:Shapovalov\|Shapovalov]] 16:08, 11 октября 2012 (MSD)		Кажется, в конспекте опечатка в псевдокоде Брента: в методе золотого сечения «если x < (c − a)/2 то» — похоже, должно быть среднее арифметическое. [[Участник:Shapovalov\|Shapovalov]] 16:08, 11 октября 2012 (MSD)

-	Ещё одна вещь мне помогла избавиться от нескольких лишних итераций трисекции перед самой сходимостью: если <tex>u</tex> находится в <tex>\eps</tex>-окрестности границы интервала, то не запускаем трисекцию сразу же, а двигаем <tex>u</tex> в допустимую зону и пытаемся идти по параболическому приближению. В противном случае, если реальная точка минимума оказывается на границе интервала, то приходится зазря сужать интервал трисекциями. Такой вариант используется в “Numerical recipes”. [[Участник:Shapovalov\|Shapovalov]] 20:05, 11 октября 2012 (MSD)	+	Ещё одна вещь мне помогла избавиться от нескольких лишних итераций трисекции перед самой сходимостью в методе Брента: если <tex>u</tex> находится в <tex>\eps</tex>-окрестности границы интервала, то не запускаем трисекцию сразу же, а двигаем <tex>u</tex> в допустимую зону и пытаемся идти по параболическому приближению. В противном случае, если реальная точка минимума оказывается на границе интервала, то приходится зазря сужать интервал трисекциями. Такой вариант используется в “Numerical recipes”. [[Участник:Shapovalov\|Shapovalov]] 20:05, 11 октября 2012 (MSD)

Обсуждение:Методы оптимизации в машинном обучении (курс лекций)/2012/Задание 1

Материал из MachineLearning.

Версия 16:06, 11 октября 2012

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты