Пробит-анализ
Материал из MachineLearning.
(Новая: здесь будет статья про пробит анализ) |
м (орфография) |
||
(6 промежуточных версий не показаны.) | |||
Строка 1: | Строка 1: | ||
- | здесь | + | '''Пробит анализ''' (probit analysis, normit analysis) — вид [[регрессионный анализ|регрессионного анализа]], используется для определения влияния [[Теория измерений|количественного]] признака на бинарный [[регрессионный анализ|отклик]]. Относится к классу [[обобщённая линейная модель|обобщённых линейных моделей]]. |
+ | |||
+ | Другие названия: | ||
+ | Пробит регрессия(probit regression), | ||
+ | пробит модель(probit model). | ||
+ | |||
+ | == Примеры задач == | ||
+ | |||
+ | '''Пример 1.Токсикология.''' | ||
+ | |||
+ | Paccмотрим выборку <tex>(x_i,y_i)_{i=1}^n</tex>, где <tex>x_i</tex> – доза токсичного вещества, <tex>y_i</tex> равна 1, если живые существа умерли от дозы <tex>x_i</tex>. Необходимо определить вероятность смерти. | ||
+ | |||
+ | '''Пример 2.Страхование жизни.''' | ||
+ | |||
+ | Paccмотрим выборку <tex>(x_i,y_i)_{i=1}^n</tex>, где <tex>x_i</tex> - возраст человека, <tex>y_i</tex> равна 1, если человек в возрасте <tex>x_i</tex> умер. Необходимо определить вероятность смерти. | ||
+ | |||
+ | '''Пример 3.Эконометрика.''' | ||
+ | |||
+ | Paccмотрим выборку <tex>(x_i,y_i)_{i=1}^n</tex>, где <tex>x_i</tex> - цена продукции, <tex>y_i</tex> равна 1, если продукцию по цене <tex>x_i</tex> купили. Необходимо определить вероятность покупки при данной цене. | ||
+ | |||
+ | |||
+ | == Описание критерия == | ||
+ | |||
+ | Рассмотрим выборку <tex>(x_i,y_i)_{i=1}^n</tex>, где <tex>x_i</tex> - количественный признак <tex>x_i \in \mathbb {R}</tex>, <tex>y_i</tex> бинарный отклик <tex>y_i \in \{0,1\}</tex>. Найдём вероятность <tex>\mathbb{P}\{ y(x)=1 \} </tex>. | ||
+ | |||
+ | Для решения задачи аппроксимируем [[функция распределения|функцию распределения вероятностей]] <tex>F(x)</tex> [[нормальное распределение|нормальным распределением]]. | ||
+ | |||
+ | '''Пробит''' <tex>p</tex> для <tex>x</tex> - это решение уравнения <tex> N(p, 5, 1) = F(x)</tex>, где <tex>N()</tex> - функция нормального распределения. | ||
+ | |||
+ | Рассмотрим множество пар <tex>(x_i,p_i)_{i=1}^n</tex>, где <tex>p_i = p(x_i)</tex>. Если модель <tex>N</tex> "угадана" хорошо, то зависимость <tex>p(x)</tex> - линейная, т.е. | ||
+ | ::<tex>p(x) = b_0 + b_1 x</tex>. {{eqno|1}} | ||
+ | А это стандартная задача [[многомерная линейная регрессия|линейной регрессии]]. | ||
+ | |||
+ | Если <tex>b_0,b_1</tex> найдены, то | ||
+ | ::<tex>\frac{x_i-\mu}{\sigma} = p_i - 5</tex>, {{eqno|2}} | ||
+ | где <tex>\mu</tex> - [[математическое ожидание]], <tex>\sigma</tex> - [[дисперсия]]. | ||
+ | |||
+ | Из {{eqref|1}},{{eqref|2}} находим формулы для <tex>\mu</tex> и <tex>\sigma</tex>: | ||
+ | ::<tex>\mu = \frac{5-b_0}{b_1}</tex>, | ||
+ | ::<tex>\sigma = \frac{1}{b_1}</tex>. | ||
+ | |||
+ | Используя определение пробита и формулы для <tex>p(x),\mu,\sigma</tex> можно вычислить функцию распределения <tex>F(x)</tex>. | ||
+ | |||
+ | == История == | ||
+ | Идея пробит-анализа впервые была опубликована Блиссом в 1934 г. в статье о влиянии пестицидов на процент убитых вредителей. Блисс предложил для учёта процента убитых вредителей использовать вероятностный блок - probability unit (или probit). Данное им определение немного отличалось использованного здесь(не было сдвига на 5). Окончательно определение пробит дал Джон Финни. | ||
+ | ==См. также== | ||
+ | [[Логит-анализ]] | ||
+ | == Ссылки == | ||
+ | * [http://en.wikipedia.org/wiki/Probit_model Probit model] (Wikipedia). | ||
+ | [[Категория:Регрессионный анализ]] | ||
+ | [[Категория: Энциклопедия анализа данных]] |
Текущая версия
Пробит анализ (probit analysis, normit analysis) — вид регрессионного анализа, используется для определения влияния количественного признака на бинарный отклик. Относится к классу обобщённых линейных моделей.
Другие названия: Пробит регрессия(probit regression), пробит модель(probit model).
Содержание |
Примеры задач
Пример 1.Токсикология.
Paccмотрим выборку , где – доза токсичного вещества, равна 1, если живые существа умерли от дозы . Необходимо определить вероятность смерти.
Пример 2.Страхование жизни.
Paccмотрим выборку , где - возраст человека, равна 1, если человек в возрасте умер. Необходимо определить вероятность смерти.
Пример 3.Эконометрика.
Paccмотрим выборку , где - цена продукции, равна 1, если продукцию по цене купили. Необходимо определить вероятность покупки при данной цене.
Описание критерия
Рассмотрим выборку , где - количественный признак , бинарный отклик . Найдём вероятность .
Для решения задачи аппроксимируем функцию распределения вероятностей нормальным распределением.
Пробит для - это решение уравнения , где - функция нормального распределения.
Рассмотрим множество пар , где . Если модель "угадана" хорошо, то зависимость - линейная, т.е.
- . (1)
- .
А это стандартная задача линейной регрессии.
Если найдены, то
- , (2)
- ,
где - математическое ожидание, - дисперсия.
Из (1),(2) находим формулы для и :
- ,
- .
Используя определение пробита и формулы для можно вычислить функцию распределения .
История
Идея пробит-анализа впервые была опубликована Блиссом в 1934 г. в статье о влиянии пестицидов на процент убитых вредителей. Блисс предложил для учёта процента убитых вредителей использовать вероятностный блок - probability unit (или probit). Данное им определение немного отличалось использованного здесь(не было сдвига на 5). Окончательно определение пробит дал Джон Финни.
См. также
Ссылки
- Probit model (Wikipedia).