Парадокс хи-квадрат

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: Скоро здесь будет статья)
Строка 1: Строка 1:
-
Скоро здесь будет статья
+
==Описание задачи==
 +
Рассматривается следующий любопытный пример из области проверки однородности с помощью [[Таблица сопряженности|критерия хи-квадрат]]. В таблицах, приведённых ниже, содержится информация о действии некоторого метода лечения (заключается в приеме определенного лекарства) смертельно опасной болезни
 +
* отдельно на мужчин
 +
* отдельно на женщин
 +
* на больных обоего пола (объединённые результаты)
 +
 
 +
{| border=1 cellpadding="6"
 +
! Мужчины|| Выздоровил || Нет ||
 +
|-
 +
! Принимал
 +
| 700 || 800
 +
|-
 +
! Нет
 +
| 80 || 130
 +
|}
 +
 
 +
{| border=1 cellpadding="6"
 +
! Женщины|| Выздоровила || Нет ||
 +
|-
 +
! Принимала
 +
| 150 || 70
 +
|-
 +
! Нет
 +
| 400 || 280
 +
|}
 +
 
 +
{| border=1 cellpadding="6"
 +
! М+Ж|| Выздоровил(а) || Нет ||
 +
|-
 +
! Принимал(а)
 +
| 850 || 870
 +
|-
 +
! Нет
 +
| 480 || 410
 +
|}
 +
 
 +
==Решение задачи==
 +
Используя [[Таблица сопряженности#Частный случай K=L=2|критерий хи-квадрат для анализа таблиц сопряженности]] получим следующие статистики:<br>
 +
* X<sup>2</sup>=5,456 для мужчин
 +
* X<sup>2</sup>=6,125 для женщин
 +
Согласно таблице распределения хи-квадрат с одной степенью свободы находим, что фактические уровни значимости равны 0,02 и 0,01. Это свидетельствует о существенности различия вероятностей выздоровления между теми, кто использовал данный метод лечения и теми, кто его не использовал, т.е. лекарство влияет на выздоровление.
 +
 
 +
С другой стороны, статистика хи-квадрат для таблицы с объединенными результатами X<sup>2</sup>=4,782, что значимо велико на уровне 0,03, т.е. лекарство не влияет на выздоровление!
 +
 
 +
Г. Секей пишет: "Аналогично, новое лекарство может оказаться эффективным в каждом из десяти различных госпиталей, но объединение результатов укажет на то, что это лекарство либо бесполезно, либо вредно".
 +
===Причина парадокса===
 +
Нехватка данных. <br>
 +
Необходимо, чтобы М<sub>п</sub>=М<sub>н</sub>=Ж<sub>п</sub>=Ж<sub>н</sub>
 +
 
 +
==Литература==
 +
# Г. Секей "Парадоксы в теории вероятностей и математической статистике"
 +
# [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2008]]

Версия 11:10, 9 января 2009

Содержание

Описание задачи

Рассматривается следующий любопытный пример из области проверки однородности с помощью критерия хи-квадрат. В таблицах, приведённых ниже, содержится информация о действии некоторого метода лечения (заключается в приеме определенного лекарства) смертельно опасной болезни

  • отдельно на мужчин
  • отдельно на женщин
  • на больных обоего пола (объединённые результаты)
Мужчины Выздоровил Нет
Принимал 700 800
Нет 80 130
Женщины Выздоровила Нет
Принимала 150 70
Нет 400 280
М+Ж Выздоровил(а) Нет
Принимал(а) 850 870
Нет 480 410

Решение задачи

Используя критерий хи-квадрат для анализа таблиц сопряженности получим следующие статистики:

  • X2=5,456 для мужчин
  • X2=6,125 для женщин

Согласно таблице распределения хи-квадрат с одной степенью свободы находим, что фактические уровни значимости равны 0,02 и 0,01. Это свидетельствует о существенности различия вероятностей выздоровления между теми, кто использовал данный метод лечения и теми, кто его не использовал, т.е. лекарство влияет на выздоровление.

С другой стороны, статистика хи-квадрат для таблицы с объединенными результатами X2=4,782, что значимо велико на уровне 0,03, т.е. лекарство не влияет на выздоровление!

Г. Секей пишет: "Аналогично, новое лекарство может оказаться эффективным в каждом из десяти различных госпиталей, но объединение результатов укажет на то, что это лекарство либо бесполезно, либо вредно".

Причина парадокса

Нехватка данных.
Необходимо, чтобы Мпнпн

Литература

  1. Г. Секей "Парадоксы в теории вероятностей и математической статистике"
  2. Статистический анализ данных (курс лекций, К.В.Воронцов)/2008
Личные инструменты