Доверительный интервал

Материал из MachineLearning.

Перейти к: навигация, поиск

Доверительный интервал — это интервал, построенный с помощью случайной выборки из распределения с неизвестным параметром, такой, что он содержит данный параметр с заданной вероятностью.

Содержание

Определение

Пусть x_1,...,x_n - выборка из некоторого распределения с плотностью p(x;\theta) = p(x_1,...,x_n;\theta), зависящей от параметра \theta, который может изменяться в интервале \theta_0 < \theta < \theta_1. Пусть y(x_1,...,x_n) - некоторая статистика и F(x;\theta)=P\{\eta \leq x\} - функция распределения случайной величины \eta = y(x_1,...,x_n), когда выборка x_1,...,x_n имеет распределение с плотностью p(x_1,...,x_n;\theta). Предположим, что F(x;\theta) есть убывающая функция от параметра \theta. Обозначим x_\gamma(\theta) квантиль распределения F(x;\theta), тогда x_\gamma(\theta) есть возрастающая функция от \theta. Зафиксируем близкое к нулю положительное число \alpha (например, 0,05 или 0,01). Пусть \alpha = \alpha_1 + \alpha_2. При каждом \theta неравенства

(1)
x_{1-\alpha_2}(\theta) \leq \eta \leq x_\alpha_1(\theta)

выполняются с вероятностью 1-\alpha, близкой к единице. Перепишем неравенства (1) в другом виде:

(2)
x_{\alpha_1}^{-1}(\eta) \leq \theta \leq x_{1-\alpha_2}^{-1}(\eta)

Обозначим x_{\alpha_1}^{-1}(\eta) = \underline{\theta}(\eta), x_{1-\alpha_2}^{-1}(\eta) = \overline{\theta}(\eta) и запишем (2) в следующем виде:

P_0\{ \underline{\theta}(\eta) \leq \theta \leq \overline{\theta}(\eta) \} = 1-\alpha

Интервал \underline{\theta}(\eta) \leq \theta \leq \overline{\theta}(\eta) называется доверительным интервалом для параметра \theta, а вероятность 1-\alpha - доверительной вероятностью.

Примеры

Пусть выборка взята из нормального распределения с параметрами (a,\ \sigma).

Доверительный интервал для a при известном \sigma:

\overline{x} - u_{\alpha_1}\frac{\sigma}{\sqrt{n}} \leq a \leq \overline{x} + u_{\alpha_2}\frac{\sigma}{\sqrt{n}}

где u_\gamma - квантиль нормального распределения.


Доверительный интервал для a при неизвестном \sigma:

\overline{x} - \frac{s}{\sqrt{n}}t_{\alpha/2}(n-1) \leq a \leq \overline{x} + \frac{s}{\sqrt{n}}t_{\alpha/2}(n-1)

где s^2 = \frac{1}{n-1}\sum\limits_{i=1}^{n}{(x_i-\overline{x})^2}, t_\gamma(n) - квантиль распределения S_n(t), S_n(t) - функция распределения Стьюдента с n степенями свободы.

См. также

Литература

  1. Севастьянов Б. А. Курс теории вероятностей и математической статистики. — Москва-Ижевск: Институт компьютерных исследований, 2004.

Ссылки

Личные инструменты