Пробит-анализ

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Полностью удалено содержимое страницы)
Текущая версия (07:36, 22 февраля 2011) (править) (отменить)
м (орфография)
 
(5 промежуточных версий не показаны.)
Строка 1: Строка 1:
 +
'''Пробит анализ''' (probit analysis, normit analysis) — вид [[регрессионный анализ|регрессионного анализа]], используется для определения влияния [[Теория измерений|количественного]] признака на бинарный [[регрессионный анализ|отклик]]. Относится к классу [[обобщённая линейная модель|обобщённых линейных моделей]].
 +
 +
Другие названия:
 +
Пробит регрессия(probit regression),
 +
пробит модель(probit model).
 +
== Примеры задач ==
 +
 +
'''Пример 1.Токсикология.'''
 +
 +
Paccмотрим выборку <tex>(x_i,y_i)_{i=1}^n</tex>, где <tex>x_i</tex> – доза токсичного вещества, <tex>y_i</tex> равна 1, если живые существа умерли от дозы <tex>x_i</tex>. Необходимо определить вероятность смерти.
 +
 +
'''Пример 2.Страхование жизни.'''
 +
 +
Paccмотрим выборку <tex>(x_i,y_i)_{i=1}^n</tex>, где <tex>x_i</tex> - возраст человека, <tex>y_i</tex> равна 1, если человек в возрасте <tex>x_i</tex> умер. Необходимо определить вероятность смерти.
 +
 +
'''Пример 3.Эконометрика.'''
 +
 +
Paccмотрим выборку <tex>(x_i,y_i)_{i=1}^n</tex>, где <tex>x_i</tex> - цена продукции, <tex>y_i</tex> равна 1, если продукцию по цене <tex>x_i</tex> купили. Необходимо определить вероятность покупки при данной цене.
 +
 +
 +
== Описание критерия ==
 +
 +
Рассмотрим выборку <tex>(x_i,y_i)_{i=1}^n</tex>, где <tex>x_i</tex> - количественный признак <tex>x_i \in \mathbb {R}</tex>, <tex>y_i</tex> бинарный отклик <tex>y_i \in \{0,1\}</tex>. Найдём вероятность <tex>\mathbb{P}\{ y(x)=1 \} </tex>.
 +
 +
Для решения задачи аппроксимируем [[функция распределения|функцию распределения вероятностей]] <tex>F(x)</tex> [[нормальное распределение|нормальным распределением]].
 +
 +
'''Пробит''' <tex>p</tex> для <tex>x</tex> - это решение уравнения <tex> N(p, 5, 1) = F(x)</tex>, где <tex>N()</tex> - функция нормального распределения.
 +
 +
Рассмотрим множество пар <tex>(x_i,p_i)_{i=1}^n</tex>, где <tex>p_i = p(x_i)</tex>. Если модель <tex>N</tex> "угадана" хорошо, то зависимость <tex>p(x)</tex> - линейная, т.е.
 +
::<tex>p(x) = b_0 + b_1 x</tex>. {{eqno|1}}
 +
А это стандартная задача [[многомерная линейная регрессия|линейной регрессии]].
 +
 +
Если <tex>b_0,b_1</tex> найдены, то
 +
::<tex>\frac{x_i-\mu}{\sigma} = p_i - 5</tex>, {{eqno|2}}
 +
где <tex>\mu</tex> - [[математическое ожидание]], <tex>\sigma</tex> - [[дисперсия]].
 +
 +
Из {{eqref|1}},{{eqref|2}} находим формулы для <tex>\mu</tex> и <tex>\sigma</tex>:
 +
::<tex>\mu = \frac{5-b_0}{b_1}</tex>,
 +
::<tex>\sigma = \frac{1}{b_1}</tex>.
 +
 +
Используя определение пробита и формулы для <tex>p(x),\mu,\sigma</tex> можно вычислить функцию распределения <tex>F(x)</tex>.
 +
 +
== История ==
 +
Идея пробит-анализа впервые была опубликована Блиссом в 1934 г. в статье о влиянии пестицидов на процент убитых вредителей. Блисс предложил для учёта процента убитых вредителей использовать вероятностный блок - probability unit (или probit). Данное им определение немного отличалось использованного здесь(не было сдвига на 5). Окончательно определение пробит дал Джон Финни.
 +
==См. также==
 +
[[Логит-анализ]]
 +
== Ссылки ==
 +
* [http://en.wikipedia.org/wiki/Probit_model Probit model] (Wikipedia).
 +
[[Категория:Регрессионный анализ]]
 +
[[Категория: Энциклопедия анализа данных]]

Текущая версия

Пробит анализ (probit analysis, normit analysis) — вид регрессионного анализа, используется для определения влияния количественного признака на бинарный отклик. Относится к классу обобщённых линейных моделей.

Другие названия: Пробит регрессия(probit regression), пробит модель(probit model).

Содержание

Примеры задач

Пример 1.Токсикология.

Paccмотрим выборку (x_i,y_i)_{i=1}^n, где x_i – доза токсичного вещества, y_i равна 1, если живые существа умерли от дозы x_i. Необходимо определить вероятность смерти.

Пример 2.Страхование жизни.

Paccмотрим выборку (x_i,y_i)_{i=1}^n, где x_i - возраст человека, y_i равна 1, если человек в возрасте x_i умер. Необходимо определить вероятность смерти.

Пример 3.Эконометрика.

Paccмотрим выборку (x_i,y_i)_{i=1}^n, где x_i - цена продукции, y_i равна 1, если продукцию по цене x_i купили. Необходимо определить вероятность покупки при данной цене.


Описание критерия

Рассмотрим выборку (x_i,y_i)_{i=1}^n, где x_i - количественный признак x_i \in \mathbb {R}, y_i бинарный отклик y_i \in \{0,1\}. Найдём вероятность \mathbb{P}\{ y(x)=1 \} .

Для решения задачи аппроксимируем функцию распределения вероятностей F(x) нормальным распределением.

Пробит p для x - это решение уравнения  N(p, 5, 1) = F(x), где N() - функция нормального распределения.

Рассмотрим множество пар (x_i,p_i)_{i=1}^n, где p_i = p(x_i). Если модель N "угадана" хорошо, то зависимость p(x) - линейная, т.е.

p(x) = b_0 + b_1 x.
(1)

А это стандартная задача линейной регрессии.

Если b_0,b_1 найдены, то

\frac{x_i-\mu}{\sigma} = p_i - 5,
(2)

где \mu - математическое ожидание, \sigma - дисперсия.

Из (1),(2) находим формулы для \mu и \sigma:

\mu = \frac{5-b_0}{b_1},
\sigma = \frac{1}{b_1}.

Используя определение пробита и формулы для p(x),\mu,\sigma можно вычислить функцию распределения F(x).

История

Идея пробит-анализа впервые была опубликована Блиссом в 1934 г. в статье о влиянии пестицидов на процент убитых вредителей. Блисс предложил для учёта процента убитых вредителей использовать вероятностный блок - probability unit (или probit). Данное им определение немного отличалось использованного здесь(не было сдвига на 5). Окончательно определение пробит дал Джон Финни.

См. также

Логит-анализ

Ссылки

Личные инструменты