Обсуждение:Логистическая регрессия
Материал из MachineLearning.
Содержание |
Логистическая регрессия
Логистическая регрессия — это метод статистического обучения, используемый для решения задач классификации, в первую очередь бинарной. Метод относится к классу обобщённых линейных моделей (GLM) и основан на предположении, что логарифм отношения шансов (log-odds) является линейной функцией признаков.
Логистическая регрессия широко применяется в задачах анализа данных, скоринга, медицины, обработки текста и других областях машинного обучения.
1. Определения
Пусть задана обучающая выборка
, где
— вектор признаков,
— метка класса.
Логистическая регрессия моделирует вероятность класса 1 как:
где — сигмоидная функция.
Функция правдоподобия выборки:
Логарифмическая функция потерь (log-loss):
где .
---
1.1 Случай двух классов
В бинарной классификации модель можно переписать через логарифм отношения шансов:
Это ключевая интерпретация логистической регрессии как линейной модели в пространстве лог-оддсов.
---
2. Обоснования
2.1 С точки зрения минимизации эмпирического риска
Логистическая регрессия возникает как решение задачи минимизации эмпирического риска:
где логистическая функция потерь:
Эта функция является гладкой верхней оценкой 0–1 потерь.
---
2.2 С точки зрения байесовской классификации
В байесовском подходе предполагается, что классы порождаются вероятностной моделью:
Оценка параметров получается методом максимального правдоподобия.
Регуляризация соответствует априорному распределению на веса (например, гауссовскому), что приводит к MAP-оценке.
(см. также обобщённые линейные модели в учебных материалах Воронцова) :contentReference[oaicite:0]{index=0}
---
3. Методы настройки весов
3.1 Градиентный метод первого порядка
Градиент функции потерь:
Обновление параметров:
Используется стохастический градиентный спуск (SGD) для больших выборок.
---
3.2 Метод второго порядка IRLS
Метод IRLS (Iteratively Reweighted Least Squares) основан на приближении Ньютона:
где H — гессиан функции потерь.
IRLS интерпретируется как последовательность взвешенных задач наименьших квадратов.
---
4. Геометрическая интерпретация (добавлено)
Логистическая регрессия строит **линейную разделяющую гиперплоскость**:
- расстояние до гиперплоскости определяет уверенность классификации
- знак определяет класс
- модуль значения связан с вероятностью
Вероятность:
Таким образом модель является **линейным классификатором с вероятностной интерпретацией**.
---
5. Многоклассовая логистическая регрессия (добавлено)
Для классов используется softmax-модель:
Функция потерь:
Многоклассовая логистическая регрессия эквивалентна: - обобщению бинарной модели - частному случаю multinomial GLM
---
6. Связь с другими методами обучения
Логистическая регрессия связана с:
- Линейные модели
- Метод максимального правдоподобия
- Обобщённые линейные модели
- SVM (через различие функций потерь: log-loss vs hinge loss)
- Нейронные сети (один слой softmax = логистическая регрессия)
Также существует связь с регуляризацией: - L2-регуляризация ↔ гауссовский приор - L1-регуляризация ↔ разреженность (аналог Lasso)
---
7. Литература
1. Hastie T., Tibshirani R., Friedman J. — The Elements of Statistical Learning, 2009 2. Bishop C. — Pattern Recognition and Machine Learning, 2006 3. Murphy K. — Machine Learning: A Probabilistic Perspective, 2012 4. McCullagh P., Nelder J. — Generalized Linear Models, 1989 5. Воронцов К.В. — Курс лекций по машинному обучению :contentReference[oaicite:1]{index=1}
---
8. Ссылки
- https://www.machinelearning.ru/wiki/ — образовательный портал MachineLearning.ru
- https://en.wikipedia.org/wiki/Logistic_regression — обзор метода
- https://www.cs.cmu.edu/~tom/mlbook.html — Mitchell, Machine Learning
---
9. Заключение
Логистическая регрессия — один из базовых и наиболее интерпретируемых методов машинного обучения. Несмотря на простоту, метод остаётся конкурентоспособным в задачах с табличными данными и часто используется как baseline-модель.

