FWER
Материал из MachineLearning.
м |
м |
||
Строка 2: | Строка 2: | ||
== Обозначения == | == Обозначения == | ||
- | Пусть <tex>H = \{ | + | Пусть <tex>H = \{H_i\}, \: i=1,\ldots,m</tex> — множество нулевых гипотез, проверяемых против альтернатив общего вида <tex>H_{Ai} = \bar{H}_i, \: i=1,\ldots,m</tex>. Если нулевая гипотеза верна, будем писать <tex>H_i=0</tex>, и <tex>H_i=1</tex> в противном случае. |
+ | |||
+ | За <tex>p =\{p_1,\ldots,p_m\}</tex> обозначим множество [[Достигаемый уровень значимости|пи-величин]], полученных при проверке соответствующих гипотез <tex>H_i</tex> подходящими статистическими критериями. | ||
Пусть <tex>M_0=\{i:\:H_i=0\}</tex> и <tex>M_1=\{i:\:H_i=1\}</tex> — неизвестные множества индексов верных и неверных нулевых гипотез, <tex>m_0=\left|M_0\right|</tex>, <tex>m_1=\left|M_1\right|</tex>, <tex>\left|M_0\cup M_1\right|=m</tex>. Количество отклонённых нулевых гипотез <tex>R</tex> и количество принятых <tex>W = m-R</tex> — наблюдаемые случайные величины, в то время как величины <tex>S</tex>,<tex>T</tex>,<tex>U</tex> и <tex>V</tex> из приведённой ниже таблицы являются ненаблюдаемыми. | Пусть <tex>M_0=\{i:\:H_i=0\}</tex> и <tex>M_1=\{i:\:H_i=1\}</tex> — неизвестные множества индексов верных и неверных нулевых гипотез, <tex>m_0=\left|M_0\right|</tex>, <tex>m_1=\left|M_1\right|</tex>, <tex>\left|M_0\cup M_1\right|=m</tex>. Количество отклонённых нулевых гипотез <tex>R</tex> и количество принятых <tex>W = m-R</tex> — наблюдаемые случайные величины, в то время как величины <tex>S</tex>,<tex>T</tex>,<tex>U</tex> и <tex>V</tex> из приведённой ниже таблицы являются ненаблюдаемыми. | ||
Строка 28: | Строка 30: | ||
|} | |} | ||
</center> | </center> | ||
- | Задача состоит в том, чтобы выбрать метод, допускающий минимальное число ложных отклонений гипотез <tex>V</tex> и ложных принятий <tex>T</tex>. | + | Задача состоит в том, чтобы выбрать метод, допускающий минимальное число ложных отклонений гипотез <tex>V</tex> и ложных принятий <tex>T</tex>. |
По определению <tex>\operator{FWER}=\operator{P}\left(V\geq 1\right)</tex>. Контроль над <tex>\operator{FWER}</tex> на фиксированном уровне <tex>\alpha</tex> означает, что выполняется неравенство <tex>\operator{FWER}\leq\alpha</tex>. | По определению <tex>\operator{FWER}=\operator{P}\left(V\geq 1\right)</tex>. Контроль над <tex>\operator{FWER}</tex> на фиксированном уровне <tex>\alpha</tex> означает, что выполняется неравенство <tex>\operator{FWER}\leq\alpha</tex>. | ||
Строка 34: | Строка 36: | ||
== Методы контроля FWER== | == Методы контроля FWER== | ||
===Поправка Бонферрони=== | ===Поправка Бонферрони=== | ||
+ | Метод Бонферрони, самый известный способ решения задачи множественной проверки гипотез, утверждает, что для контроля над <tex>\operator{FWER}</tex> на уровне <tex>\alpha</tex> достаточно, чтобы отвергались те и только те гипотезы <tex>H_i</tex>, для которых <tex> p_i \leq \alpha/m</tex>. Соответствующие модифицированные достигаемые уровни значимости вычисляются по формуле | ||
+ | ::<tex>\tilde{p}_i=\min\left(mp_i,1\right)</tex>. | ||
+ | Контроль над <tex>\operator{FWER}</tex> обеспечивается по неравенству Буля: | ||
+ | :: <tex>\operator{FWER} \:=\: \operator{P}\left(V\geq 1\right) \:\leq\: \operator{P}\left(\bigcup_{i=1}^{m_0} \left\{ \tilde{P}_i \leq \alpha \right\} \right) \:\leq\: \sum_{i=1}^{m_0}\operator{P}\left( \tilde{P}_i \leq \alpha \right) \:\leq\: \sum_{i=1}^{m_0} \alpha/m \:=\: m_0\alpha/m \:\leq\: \alpha.</tex> | ||
+ | Видно, что оценка | ||
===Метод Холма=== | ===Метод Холма=== | ||
===Метод Хохберга=== | ===Метод Хохберга=== |
Версия 14:33, 14 сентября 2010
FWER (familywise error rate, групповая вероятность ошибки (первого рода)) — одна из мер, обобщающих ошибку первого рода, рассматриваемую при проверке статистических гипотез, на многомерный случай задачи множественной проверки гипотез. Величина определена как вероятность совершить хотя бы одну ошибку первого рода.
Содержание |
Обозначения
Пусть — множество нулевых гипотез, проверяемых против альтернатив общего вида . Если нулевая гипотеза верна, будем писать , и в противном случае.
За обозначим множество пи-величин, полученных при проверке соответствующих гипотез подходящими статистическими критериями.
Пусть и — неизвестные множества индексов верных и неверных нулевых гипотез, , , . Количество отклонённых нулевых гипотез и количество принятых — наблюдаемые случайные величины, в то время как величины ,, и из приведённой ниже таблицы являются ненаблюдаемыми.
Число принятых гипотез | Число отвергнутых гипотез | Всего | |
---|---|---|---|
Число верных гипотез | |||
Число неверных гипотез | |||
Всего |
Задача состоит в том, чтобы выбрать метод, допускающий минимальное число ложных отклонений гипотез и ложных принятий .
По определению . Контроль над на фиксированном уровне означает, что выполняется неравенство .
Методы контроля FWER
Поправка Бонферрони
Метод Бонферрони, самый известный способ решения задачи множественной проверки гипотез, утверждает, что для контроля над на уровне достаточно, чтобы отвергались те и только те гипотезы , для которых . Соответствующие модифицированные достигаемые уровни значимости вычисляются по формуле
- .
Контроль над обеспечивается по неравенству Буля:
Видно, что оценка
Метод Холма
Метод Хохберга
Метод Шидака
minP
Перестановочные методы
Метод Хоммеля
Последовательная проверка
Контроль FWER для иерархических семейств гипотез
Связь с другими мерами ошибки первого рода
Ссылки
- Familywise error rate — статья из английской Википедии.