Статистическое оценивание
Материал из MachineLearning.
м (→Состоятельность: терминология) |
(дополнение) |
||
Строка 27: | Строка 27: | ||
Условие состоятельности является практически обязательным для всех используемых на практике оценок. Несостоятельные оценки используются крайне редко. | Условие состоятельности является практически обязательным для всех используемых на практике оценок. Несостоятельные оценки используются крайне редко. | ||
- | ====Несмещенность==== | + | ====Несмещенность и асимптотическая несмещенность==== |
+ | Оценка <tex>\widehat\theta_n</tex> параметра <tex>\theta</tex> называется '''несмещенной''', если ее математическое ожидание равно истинному значению оцениваемого параметра: | ||
+ | |||
+ | <center><tex>\mathbb{M}\widehat\theta_n=\theta</tex>.</center> | ||
+ | |||
+ | Более слабым условием является '''асимптотическая несмещенность''', которая означает, что математическое ожидание оценки сходится к истинному значению параметра с ростом объема выборки: | ||
+ | |||
+ | <center><tex>\lim_{n\to\infty}\mathbb{M}\widehat\theta_n=\theta</tex>.</center> | ||
+ | |||
+ | Несмещенность является рекомендуемым свойством оценок. Однако не следует слишком переоценивать его значимость. Чаще всего несмещенные оценки параметров существуют и тогда стараются рассматривать только их. Однако существуют такие статистические задачи, в которых несмещенных оценок не существует. Наиболее известным примером является следующий: рассмотрим [[распределение Пуассона]] с параметром <tex>\lambda</tex> и поставим задачу оценки параметра <tex>\theta=1/\lambda</tex>. Можно доказать, что для этой задачи не существует несмещенной оценки. | ||
+ | |||
+ | ====Сравнение оценок и эффективность==== | ||
Версия 08:01, 11 ноября 2009
Содержание |
Постановка задачи
Задача статистического оценивания неизвестных параметров - одна из двух основных (наряду с задачей проверки статистических гипотез) задач математической статистики.
Предположим, что имеется параметрическое семейство распределений вероятностей (для простоты будем рассматривать распределение случайных величин и случай одного параметра). Здесь - числовой параметр, значение которого неизвестно. Требуется оценить его по имеющейся выборке значений, порожденной данным распределением.
Различают два основных типа оценок: точечные оценки и доверительные интервалы.
Точечное оценивание
Точечное оценивание - это вид статистического оценивания, при котором значение неизвестного параметра приближается отдельным числом. То есть необходимо указать функцию от выборки (статистику)
значение которой будет рассматриваться в качестве приближения к неизвестному истинному значению .
Ниже приводятся некоторые свойства, которыми могут обладать или не обладать точечные оценки.
Состоятельность
Одно из самых очевидных требований к точечной оценке заключается в том, чтобы можно было ожидать достаточно хорошего приближения к истинному значению параметра при достаточно больших значениях объема выборки . Это означает, что оценка должна сходиться к истинному значению при . Это свойство оценки и называется состоятельностью. Поскольку речь идет о случайных величинах, для которых имеются разные виды сходимости, то и данное свойство может быть точно сформулировано по-разному:
- если сходится к истинному значению с вероятностью 1 (почти наверное), то тогда оценка называется сильно состоятельной;
- если имеет место сходимость по вероятности , то тогда оценка называется слабо состоятельной.
Когда употребляют просто термин состоятельность, то обычно имеется в виду слабая состоятельность, т.е. сходимость по вероятности.
Условие состоятельности является практически обязательным для всех используемых на практике оценок. Несостоятельные оценки используются крайне редко.
Несмещенность и асимптотическая несмещенность
Оценка параметра называется несмещенной, если ее математическое ожидание равно истинному значению оцениваемого параметра:
Более слабым условием является асимптотическая несмещенность, которая означает, что математическое ожидание оценки сходится к истинному значению параметра с ростом объема выборки:
Несмещенность является рекомендуемым свойством оценок. Однако не следует слишком переоценивать его значимость. Чаще всего несмещенные оценки параметров существуют и тогда стараются рассматривать только их. Однако существуют такие статистические задачи, в которых несмещенных оценок не существует. Наиболее известным примером является следующий: рассмотрим распределение Пуассона с параметром и поставим задачу оценки параметра . Можно доказать, что для этой задачи не существует несмещенной оценки.
Сравнение оценок и эффективность
...to be continued...
К точечному оцениванию относятся метод моментов, метод минимального расстояния , метод максимального правдоподобия, метод наименьших квадратов.
Свойства точечных оценок
(оценка сходится по вероятности к параметру )
- где
(эффективная оценка обладает минимальной дисперсией среди всех несмещенных оценок)
- Статистика называется достаточной, если
Критерий факторизации
Теорема
Статистика является достаточной тогда и только тогда, когда
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
Ссылки
- Статистическое оценивание(Яндекс.Словари)
- Точечная оценка (Википедия)
- Point estimation (Wikipedia)
- Estimator (Wikipedia)