Методы оптимизации в машинном обучении (курс лекций)/2012/Задание 3
Материал из MachineLearning.
Текст задания находится в стадии формирования. Просьба не приступать к выполнению задания до тех пор, пока это предупреждение не будет удалено. |
Начало выполнения задания: 24 ноября 2012
Срок сдачи: 7 декабря 2012 (пятница), 23:59
Среда реализации задания – MATLAB.
Модель -регуляризованной линейной регрессии
Формулировка метода
Рассматривается задача восстановления регрессии. Имеется обучающая выборка , где — вектор признаков для объекта , а — его регрессионное значение. Задача заключается в прогнозировании регрессионного значения для нового объекта, представленного своим вектором признаков .
В линейной регрессии прогнозирование осуществляется с помощью линейной функции:
,
где — некоторые веса. Настройка весов осуществляется путем минимизации следующего регуляризованного критерия:
.
Здесь — задаваемый пользователем параметр регуляризации. Использование -регуляризации позволяет, во-первых, снизить вероятность переобучения алгоритма, а во-вторых, получить т.н. разреженное решение. В разреженном решении часть компонент оптимального вектора весов равно нулю. Нулевые веса для некоторых признаков равносильны их исключению из модели (признание их неинформативными).
Двойственная задача
Рассмотрим получение двойственной задачи оптимизации для задачи (1). Для этого рассмотрим эквивалентную постановку данной задачи в виде задачи условной оптимизации:
Далее можно показать, что двойственной к данной задаче выпуклой оптимизации будет следующая:
Здесь под понимается .
Гладкая задача
Задачу выпуклой негладкой оптимизации (1) можно эквивалентно представить в виде задачи гладкой условной минимизации:
Формулировка задания
- Вывести двойственную задачу оптимизации для задачи обучения -регуляризованной линейной регрессии;
- Для полученной двойственной задачи предложить формулу вычисления допустимой двойственной точки по заданной прямой точке, на ее основе записать верхнюю оценку на зазор между решениями прямой и двойственной задач;
- Вывести необходимые формулы для решения гладкой задачи обучения (*) с помощью метода барьерных функций; предложить свой способ эффективного решения соответствующей СЛАУ, необходимые для этого формулы вставить в отчет;
- Реализовать метод барьерных функций для решения задачи (*);
- Вывести необходимые формулы для решения двойственной задачи с помощью прямо-двойственного метода внутренней точки; предложить свой способ эффективного решения возмущенной ККТ-системы, необходимые для этого формулы вставить в отчет;
- Реализовать прямо-двойственный метод внутренней точки для двойственной задачи;
- Реализовать на выбор проксимальный или покоординатный метод для решения задачи обучения -регуляризованной линейной регрессии;
- Провести экспериментальное сравнение трех реализованных методов на предмет скорости работы при 1) различных соотношениях между количеством объектов и признаков в данных и 2) различных значениях параметра точности ;
- Написать отчет в формате PDF с описанием всех проведенных исследований. Данный отчет должен содержать, в частности, необходимые формулы для всех методов. Также во всех приведенных экспериментах должно быть указано количество итераций, точность, параметры и время работы методов.
Спецификация реализуемых функций
Метод золотого сечения | |||||||
---|---|---|---|---|---|---|---|
[x_min, f_min, status] = min_golden(func, interval, param_name1, param_value1, ...) | |||||||
ВХОД | |||||||
| |||||||
ВЫХОД | |||||||
|
Прототипы функций min_parabolic для метода парабол, min_qubic для кубических аппроксимаций и min_brent для метода Брента выглядят аналогично. В методе Брента добавляется параметр 'use_gradient' с возможными значениями true и false для учета случая оптимизации с производной и без. При отображении в методе Брента необходимо указывать способ выбора очередной точки на каждой итерации (golden/parabolic или bisection/parabolic).
Метод Флетчера | ||||||||
---|---|---|---|---|---|---|---|---|
[alpha_min, f_min, status] = min_fletcher(func, x, d, param_name1, param_value1, ...) | ||||||||
ВХОД | ||||||||
| ||||||||
ВЫХОД | ||||||||
|
Оформление задания
Выполненный вариант задания необходимо прислать письмом по адресу bayesml@gmail.com с темой «[МОМО12] Задание 3. ФИО». Убедительная просьба присылать выполненное задание только один раз с окончательным вариантом. Новые версии будут рассматриваться только в самом крайнем случае. Также убедительная просьба строго придерживаться заданной выше спецификации реализуемых функций.
Письмо должно содержать:
- PDF-файл с описанием проведенных исследований;
- Файлы min_golden.m, min_quadratic.m, min_cubic.m, min_brent.m, min_fletcher.m;
- Набор вспомогательных файлов при необходимости.