Лассо Тибширани
Материал из MachineLearning.
(→Пример задачи) |
|||
(5 промежуточных версий не показаны.) | |||
Строка 2: | Строка 2: | ||
==Пример задачи== | ==Пример задачи== | ||
- | В больнице лежит пациент, больной раком простаты. Требуется изучить корреляцию специального антигена простаты и некоторого количесива тестов. В качестве | + | В больнице лежит пациент, больной раком простаты. Требуется изучить корреляцию специального антигена простаты и некоторого количесива тестов. В качестве факторов берём клинические тесты, а откликом будет специальный антиген. |
==Метод Лассо== | ==Метод Лассо== | ||
Строка 45: | Строка 45: | ||
</tex> | </tex> | ||
- | + | Это задача по теореме Куна-Такера | |
<tex>\exists j:\ \theta_j^{+}=\theta_j^{-}=0</tex>. Однако решается довольно долго. | <tex>\exists j:\ \theta_j^{+}=\theta_j^{-}=0</tex>. Однако решается довольно долго. | ||
Строка 51: | Строка 51: | ||
==Литература== | ==Литература== | ||
- | *{{ | + | *{{книга |
|автор = Robert Tibshirani | |автор = Robert Tibshirani | ||
|название = Regression shrinkage and selection via the lasso | |название = Regression shrinkage and selection via the lasso | ||
Строка 59: | Строка 59: | ||
|страницы = 267--288 | |страницы = 267--288 | ||
}} | }} | ||
+ | |||
== См. также == | == См. также == | ||
* [[Мультиколлинеарность]] | * [[Мультиколлинеарность]] | ||
* [[Ридж-регрессия]] | * [[Ридж-регрессия]] | ||
+ | * [[Лассо]] | ||
+ | * [[LARS]] | ||
+ | * [[Регрессионный анализ]] | ||
== Ссылки == | == Ссылки == | ||
- | [http://en.wikipedia.org/wiki/Regularization_(machine_learning) Regularization(mathematics)] (Wikipedia) | + | * [http://en.wikipedia.org/wiki/Regularization_(machine_learning) Regularization(mathematics)] (Wikipedia) |
+ | |||
+ | [[Категория:Регрессионный анализ]] | ||
[[Категория: Прикладная статистика]] | [[Категория: Прикладная статистика]] | ||
- |
Текущая версия
Лассо Тибширани (англ.LASSO - Least Absolute Shrinkage and Selection Operator) - это метод понижения размерности, предложенный Тибширани в 1995г. Этот метод минимизирует RSS при условии, что сумма абсолютных значений коэффициентов меньше константы. Из-за природы этих ограничений некоторый коэффициенты получаются равными нулю.
Содержание |
Пример задачи
В больнице лежит пациент, больной раком простаты. Требуется изучить корреляцию специального антигена простаты и некоторого количесива тестов. В качестве факторов берём клинические тесты, а откликом будет специальный антиген.
Метод Лассо
Постановка задачи:
.
Переформулируем её в таком виде.
Если уменьшается , то устойчивость увеличивается и количество ненулевых коэффициентов уменьшается, т.о. происходит отбор признаков.
Эта задача удовлетворяет условиям теоремы Куна-Таккера. Однако тяжело думать, что алгоритм остановится толко после итераций, особенно при больших . На практике было замечено, что среднее число итераций варьируется в переделах .
Видоизменённый метод Лассо
Совершенно другой алгоритм для решения задачи предложил David Gay.
Записываем как ,
где и
Мы перешли от основной задачи с переменными и ограничениями к новой задаче с переменными и ограничениями.
Это задача по теореме Куна-Такера . Однако решается довольно долго.
После сравнения этих двух методов оказалось, что обычно второй работает чуть быстрее первого метода.
Литература
- Robert Tibshirani Regression shrinkage and selection via the lasso. — 1996. — С. 267--288.
См. также
Ссылки
- Regularization(mathematics) (Wikipedia)