Доверительный интервал

Материал из MachineLearning.

(Различия между версиями)

Serostanov (Обсуждение | вклад)
(Новая: '''Доверительный интервал''' - это интервал, построенный с помощью случайной выборки из распределения с...)
К следующему изменению →

Версия 23:09, 9 января 2009

Доверительный интервал - это интервал, построенный с помощью случайной выборки из распределения с неизвестным параметром, такой, что он содержит данный параметр с заданной вероятностью.

Определение

Пусть $x_1,...,x_n$ - выборка из некоторого распределения с плотностью $p(x;\theta) = p(x_1,...,x_n;\theta)$ , зависящей от параметра $\theta$ , который может изменяться в интервале $\theta_0 < \theta < \theta_1$ . Пусть $y(x_1,...,x_n)$ - некоторая статистика и $F(x;\theta)=P\{\eta \leq x\}$ - функция распределения случайной величины $\eta = y(x_1,...,x_n)$ , когда выборка $x_1,...,x_n$ имеет распределение с плотностью $p(x_1,...,x_n;\theta)$ . Предположим, что $F(x;\theta)$ есть убывающая функция от параметра $\theta$ . Обозначим $x_\gamma(\theta)$ квантиль распределения $F(x;\theta)$ , тогда $x_\gamma(\theta)$ есть возрастающая функция от $\theta$ . Зафиксируем близкое к нулю положительное число $\alpha$ (например, 0,05 или 0,01). Пусть $\alpha = \alpha_1 + \alpha_2$ . При каждом $\theta$ неравенства

(1)

$x_{1-\alpha_2}(\theta) \leq \eta \leq x_\alpha_1(\theta)$

выполняются с вероятностью $1-\alpha$ , близкой к единице. Перепишем неравенства (1) в другом виде:

(2)

$x_{\alpha_1}^{-1}(\eta) \leq \theta \leq x_{1-\alpha_2}^{-1}(\eta)$

Обозначим $x_{\alpha_1}^{-1}(\eta) = \underline{\theta}(\eta)$ , $x_{1-\alpha_2}^{-1}(\eta) = \overline{\theta}(\eta)$ и запишем (2) в следующем виде:

$P_0\{ \underline{\theta}(\eta) \leq \theta \leq \overline{\theta}(\eta) \} = 1-\alpha$

Интервал $\underline{\theta}(\eta) \leq \theta \leq \overline{\theta}(\eta)$ называется доверительным интервалом для параметра $\theta$ , а вероятность $1-\alpha$ - доверительной вероятностью.

Примеры

Пусть выборка взята из нормального распределения с параметрами $(a,\ \sigma)$ .

Доверительный интервал для $a$ при известном $\sigma$ :

$\overline{x} - u_{\alpha_1}\frac{\sigma}{\sqrt{n}} \leq a \leq \overline{x} + u_{\alpha_2}\frac{\sigma}{\sqrt{n}}$

где $u_\gamma$ - квантиль нормального распределения.

Доверительный интервал для $a$ при неизвестном $\sigma$ :

$\overline{x} - \frac{s}{\sqrt{n}}t_{\alpha/2}(n-1) \leq a \leq \overline{x} + \frac{s}{\sqrt{n}}t_{\alpha/2}(n-1)$

где $s^2 = \frac{1}{n-1}\sum\limits_{i=1}^{n}{(x_i-\overline{x})^2}$ , $t_\gamma(n)$ - квантиль распределения $S_n(t)$ , $S_n(t)$ - функция распределения Стьюдента с $n$ степенями свободы.