Пробит-функция

Материал из MachineLearning.

Версия от 18:07, 4 июля 2026; Kirill Bazhutov (Обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск
Статья написана с использованием LLM Gemini и проверена участником Kirill Bazhutov 22:07, 4 июля 2026 (MSD)


Пробит-функция (Probit function) — в математической статистике квантильная функция стандартного нормального распределения. Она является обратной функцией к функции распределения (cumulative distribution function, CDF) стандартного нормального распределения \Phi(x).

Термин «пробит» является сокращением от англ. probability unit (единица вероятности); он был введён Честером Блиссом (Chester I. Bliss) в 1934 году в контексте анализа дозо-ответных зависимостей.

Содержание

Математическое определение

Пусть \Phi(x) — функция распределения стандартного нормального распределения:

\Phi(x) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{x} e^{-\frac{t^2}{2}} dt

Пробит-функция \text{probit}(p) для вероятности p \in (0, 1) определяется как значение x, для которого \Phi(x) = p:

\text{probit}(p) = \Phi^{-1}(p)

Связь с функцией ошибок erf выражается следующей формулой:

\text{probit}(p) = \sqrt{2} \cdot \text{erf}^{-1}(2p - 1)

Пробит-функция строго возрастает и отображает интервал (0, 1) на всю вещественную прямую:

\lim_{p\to 0+}\text{probit}(p) = -\infty, \quad \lim_{p\to 1-}\text{probit}(p) = +\infty

Производная пробит-функции выражается через плотность стандартного нормального распределения \varphi(x):

\frac{d}{dp}\Phi^{-1}(p) = \frac{1}{\varphi(\Phi^{-1}(p))}

Пробит-функция не имеет аналитического выражения через элементарные функции, поэтому для её вычисления используются численные методы. В классическом пробит-анализе также встречается сдвинутая шкала \text{probit}(p) + 5, введённая для удобства работы с положительными значениями.

Статистическое применение: пробит-модель

Пробит-функция используется как функция связи (link function) в пробит-регрессии — виде обобщённой линейной модели для бинарных зависимых переменных. В терминах GLM функция связи имеет вид:

g(\mu) = \Phi^{-1}(\mu)

Тогда обратная функция связи задаёт вероятность положительного исхода:

P(y=1 \mid x) = \Phi(x^T \beta)

Сравнение с логистической регрессией

Пробит-модель часто сравнивают с логистической регрессией, где функция связи имеет вид:

\operatorname{logit}(\mu) = \log\frac{\mu}{1-\mu}

Обратная функция связи (логистическая сигмоида) задаётся формулой:

P(y=1 \mid x) = \sigma(x^T \beta) = \frac{1}{1 + e^{-x^T \beta}}
  • Хвосты распределений: Нормальное распределение имеет более тонкие хвосты, чем логистическое, поэтому при экстремальных значениях линейного предиктора пробит- и логит-модели могут давать несколько разные вероятности.
  • Интерпретируемость: В моделях с латентными переменными пробит-подход часто более естественен, если ошибка латентной переменной предполагает нормальное распределение.

Связь с Z-оценкой

В статистическом анализе значение \text{probit}(p) соответствует z-оценке, отделяющей нижнюю долю p площади под кривой стандартного нормального распределения. Например:

  • \text{probit}(0.5) = 0 (медиана).
  • \text{probit}(0.975) \approx 1.96 (критическое значение для двустороннего доверительного интервала 95%).

См. также

Литература

  • Bliss C. I. The method of probits // Science. — 1934. — Т. 79. — № 2037. — С. 38–39.
  • Finney D. J. Probit Analysis. — Cambridge University Press, 1971.
  • McCullagh P., Nelder J. A. Generalized Linear Models. — Chapman and Hall/CRC, 1989.
  • Agresti A. An Introduction to Categorical Data Analysis. — Wiley, 2007.
Личные инструменты