Интервальная оценка

Материал из MachineLearning.

Перейти к: навигация, поиск

Интервальное оценивание - один из видов статистического оценивания, предполагающий построение интервала, в котором с некоторой вероятностью находится истинное значение оцениваемого параметра.

Содержание

Определение

Пусть \theta - неизвестный параметр генеральной совокупности. По сделанной выборке по определенным правилам находятся числа \theta_1 и \theta_2, такие чтобы выполнялось неравенство:

P\{\theta_1 < \theta < \theta_2 \} = 1-\alpha.

Интервал (\theta_1, \theta_2) является доверительным интервалом для параметра \theta, а число 1-\alpha - доверительной вероятностью или надежностью сделанной оценки. Обычно надежность задается заранее, причем выбираются числа близкие к 1 (0.95, 0.99 или 0.999).

Примеры интервальных оценок

Пример 1. Доверительное оценивание по вариационному ряду.

Пусть задана выборка X^n=(x_1,\cdots,x_n) некоторой случайной величины X. Построим вариационный ряд выборки x^{(1)}<\cdots<x^{(n)}:


Очевидно, что вероятность попасть в любой из (n+1) - го интервалов значений случайной ведичины X одинакова и равна \frac1{n+1}. Тогда вероятность того, что случайная величина X приняла значение из интервала (x^{(k)},x^{(l)}), где l>k будет равна:

P_{X^n,x}\{x\in(x^{(k)},x^{(l)})\} = \frac{l-k}{n+1}.

Вопрос: чему должен быть равен размер выборки n, чтобы вероятность попасть в интервал (\min\limits_i(x_i), \max\limits_i(x_i)) составила 95%.

Подставляя значение для доверительной вероятности в формулу выше, получим:
0.95 = P_{X^n,x}\{x\in(x^{(1)},x^{(n)})\} = \frac{n-1}{n+1},
откуда n=39.

Таким образом, при достаточном для заданной доверительной вероятности числе измерений случайной величины X по набору ее порядковых статистик может быть оценен диапазон принимаемых ею значений.

Пример 2. Доверительный интервал для медианы.

Таблица 1
Таблица 1

Пусть задана выборка X^n=(x_1,\cdots,x_n) некоторой случайной величины X.

x_k \leq \tilde x \leq x_{n-k+1},
где
k = \frac12 (n-1.64\sqrt n-1) при \alpha=0.1;
k = \frac12 (n-1.96\sqrt n-1) при \alpha=0.05;
k = \frac12 (n-2.58\sqrt n-1) при \alpha=0.01.
  • Для значений n\leq50 номера порядковых статистик, заключающих в себе медиану, при \alpha=0.05 и \alpha=0.01 приведены в таблице 1, взятой из [3].

Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
  2. Гмурман В. Е. Теория вероятностей и математическая статистика. - М.: Высшая Школа, 2003.
  3. Закс Л. Статистическое оценивание / Пер. с нем. - М.: Статистика, 1976.

См. также

Ссылки

Личные инструменты