Эластичная сеть

Материал из MachineLearning.

(Различия между версиями)

Версия 22:07, 5 января 2014

Эластичная сеть — модель регрессии с двумя регуляризаторами l1, l2^[1].

Содержание

1 Определение
2 Реализации
3 Пример
4 Ссылки

Определение

Пусть известны измерения $n$ объектов. Каждый объект представим в виде пары $(x_i, y_i)$ , $x_i \in \mathbb{R}^k$ , $y_i \in \mathbb{R}$ . Для удобства будем записывать это в матричном виде: $(X, y)$ . Классическая задача регрессии ставится следующим образом:

$\left|y - Xw\right|^2 \to \min_w$ .

В силу неточности измерений данных или каких либо еще ошибок с целью построения наилучшей модели вводят регуляризатор или несколько регуляризаторов. Тогда получается следующая задача оптимизации:

Частными случаями являются модели лассо ( $\lambda_2 = 0$ ) и гребневой регрессии ( $\lambda_1 = 0$ ). Для каждого фиксированного $\lambda_2$ можно перебрать все возможные значения параметра $\lambda_1$ (поскольку по этому параметру это кусочно-линейная функция с конечным числом точек, в которых она не дифференцируема)^[1].

Реализации

Matlab: Функция lasso, для задания l2 регуляризации есть дополнительный аргумент Alpha^[1].
Python: В пакете sklearn есть библиотека linear_model в которой есть класс ElasticNet^[1].
R: Пакет glmnet^[1].

Во всех реализациях используется подход LARS, который как раз и позволяет найти все точки перегиба функционала по $\lambda_1$ .

Также в Matlab и Python есть соответствующие функции для выбора оптимальных значений параметров по кросс-валидации: в Matlab это все та же функция lasso, в Python это класс ElasticNetCV.

Пример

Пример использования Lasso и ElasticNet в Python на основе данных о диабете. Строится две модели $\lambda_2 = 0$ (Lasso), $\lambda_2 = 0.7$ (Elastic-Net). На графике изображены значения весов обученной модели в зависимости от коэффициента регуляризации $\lambda_1$ .

Ссылки

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%AD%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D1%87%D0%BD%D0%B0%D1%8F_%D1%81%D0%B5%D1%82%D1%8C»

Категории: Линейная регрессия | Регрессионный анализ

@@ Строка 1: / Строка 1: @@
-'''Эластичная сеть''' — модель регрессии с двумя регуляризаторами L1, L2.
+'''Эластичная сеть''' — модель [[Регрессия|регрессии]] с двумя регуляризаторами l1, l2<ref name="elnet"> Zou H., Hastie T. (2005). [http://www.stanford.edu/~hastie/Papers/B67.2%20(2005)%20301-320%20Zou%20&%20Hastie.pdf Regularization and variable selection via the elastic net.] Journal of the Royal Statistical Society, 5(2), 427–320.</ref>.
 == Определение ==
-Пусть известны измерения n-объектов. Каждый объект представим в виде пары <tex>(x_i, y_i)</tex>, <tex> x_i \in \mathbb{R}^k</tex>, <tex> y_i \in \mathbb{R} </tex>. Для удобства будем записывать это в матричном виде: <tex>(X, y) </tex>. Классическая задача регрессии ставится следующим образом: <tex>\|y - Xw\|^2 \to \min_w</tex>. В силу неточности измерений данных или каких либо еще ошибок с целью построения наилучшей модели вводят регуляризатор или несколько регуляризаторов. Тогда получается следующая задача оптимизации: <tex>\|y - Xw\|^2_2 + \lambda_1 \|w\|_1 + \lambda_2 \|w\|^2_2 \to \min_w</tex>. Из достоинств такой модели можно выделить следующее: для каждого фиксированного L2-регуляризатора можно перебрать все возможные значения параметра <tex>\lambda_1</tex>(Поскольку по этому параметру это кусочно-линейная функция с конечным числом точек, в которых она не дифференцируема). Частным случаем этой модели являются модели Lasso(<tex>\lambda_2 = 0</tex>) и Ridge(<tex>\lambda_1 = 0 </tex>) регрессий.
+Пусть известны измерения <tex>n</tex> объектов. Каждый объект представим в виде пары <tex>(x_i, y_i)</tex>, <tex> x_i \in \mathbb{R}^k</tex>, <tex> y_i \in \mathbb{R} </tex>. Для удобства будем записывать это в матричном виде: <tex>(X, y) </tex>. [[Многомерная линейная регрессия|Классическая задача регрессии]] ставится следующим образом:
+::<tex>\left|y - Xw\right|^2 \to \min_w</tex>.
+В силу неточности измерений данных или каких либо еще ошибок с целью построения наилучшей модели вводят регуляризатор или несколько регуляризаторов. Тогда получается следующая задача оптимизации:
+::<tex>\left|y - Xw\right|^2_2 + \lambda_1 \left|w\right|_1 + \lambda_2 \left|w\right|^2_2 \to \min_w</tex>.
+Частными случаями являются модели [[лассо]] (<tex>\lambda_2 = 0</tex>) и [[Гребневая регрессия|гребневой регрессии]] (<tex>\lambda_1 = 0 </tex>).
+Для каждого фиксированного <tex>\lambda_2</tex> можно перебрать все возможные значения параметра <tex>\lambda_1</tex> (поскольку по этому параметру это кусочно-линейная функция с конечным числом точек, в которых она не дифференцируема)<ref name="lars"> Efron B., Hastie T., Johnstone I., Tibshirani R. (2004). [http://statweb.stanford.edu/~imj/WEBLIST/2004/LarsAnnStat04.pdf Least angle regression.] The Annals of Statistics, 32(2), 407–499.</ref>.
 == Реализации ==
+* Matlab: Функция lasso, для задания l2 регуляризации есть дополнительный аргумент Alpha<ref name="matlab"> [http://www.mathworks.com/help/stats/lasso.html Regularized least-squares regression using lasso or elastic net algorithms]</ref>.
+* Python: В пакете sklearn есть библиотека linear_model в которой есть класс ElasticNet<ref name="python"> Пример: [http://scikit-learn.org/0.11/auto_examples/linear_model/plot_lasso_and_elasticnet.html#example-linear-model-plot-lasso-and-elasticnet-py Lasso and Elastic Net for Sparse Signals]</ref>.
+* R: Пакет glmnet<ref name="r"> [http://cran.r-project.org/web/packages/glmnet/index.html glmnet: Lasso and elastic-net regularized generalized linear models]</ref>.
+Во всех реализациях используется подход [[LARS]], который как раз и позволяет найти все точки перегиба функционала по <tex> \lambda_1</tex>.
-* Matlab: Функция lasso, для задания L2 регуляризации есть дополнительный аргумент Alpha.
+Также в Matlab и Python есть соответствующие функции для выбора оптимальных значений параметров по кросс-валидации: в Matlab это все та же функция lasso, в Python это класс ElasticNetCV.
-* Python: В пакете sklearn есть библиотека linear_model в которой есть класс ElasticNet.
-* R: Пакет glmnet.
-Во всех реализациях используется подход LARS, который как раз и позволяет найти все точки перегиба функционала по <tex> \lambda_1</tex>.
-Также в Matlab и Python есть соответсвующие функции для выбора оптимальных значений параметров по кроссвалидации, в matlab это все та же функция lasso, в Python это класс ElasticNetCV
 ==Пример ==
 [[Изображение: Lasso_and_elastic_net_example.png]]
+[http://scikit-learn.org/stable/auto_examples/linear_model/plot_lasso_coordinate_descent_path.html#example-linear-model-plot-lasso-coordinate-descent-path-py Пример использования Lasso и ElasticNet] в Python на основе данных о диабете. Строится две модели <tex>\lambda_2 = 0</tex> (Lasso), <tex>\lambda_2 = 0.7</tex> (Elastic-Net). На графике изображены значения весов обученной модели в зависимости от коэффициента регуляризации <tex>\lambda_1</tex>.
+== Ссылки ==
+<references />
-[http://scikit-learn.org/stable/auto_examples/linear_model/plot_lasso_coordinate_descent_path.html#example-linear-model-plot-lasso-coordinate-descent-path-py Пример использования Lasso и ElasticNet] в Python на основе данных о диабете. Строится две модели L2 = 0(Lasso), L2 = 0.7(Elastic). На графике изображены значения соответсвующих весов обученной модели в зависимости от L1 регуляризатора.
+[[Категория:Линейная регрессия]]
-== Ссылки ==
+[[Категория:Регрессионный анализ]]
-* The Annals of Statistics 2004, Vol. 32, No. 2, 407–499, Institute of Mathematical Statistics, 2004, [http://statweb.stanford.edu/~imj/WEBLIST/2004/LarsAnnStat04.pdf LARS]
-* Matlab [http://www.mathworks.com/help/stats/lasso.html lasso]
-* R [http://cran.r-project.org/web/packages/glmnet/index.html glmnet]
-* Python пример с [http://scikit-learn.org/0.11/auto_examples/linear_model/plot_lasso_and_elasticnet.html#example-linear-model-plot-lasso-and-elasticnet-py lasso and elastic]
-* Подробное описание ElasticNet и Lasso [http://www.stanford.edu/~hastie/Papers/B67.2%20(2005)%20301-320%20Zou%20&%20Hastie.pdf Regularization and variable selection via the
-elastic net]

Эластичная сеть

Материал из MachineLearning.

Версия 22:07, 5 января 2014

Содержание

Определение

Реализации

Пример

Ссылки

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты