FWER
Материал из MachineLearning.
м (→Метод Холма) |
м |
||
Строка 2: | Строка 2: | ||
== Обозначения == | == Обозначения == | ||
- | Пусть <tex>H = \{H_i\}, \: i=1,\ldots,m</tex> — множество нулевых гипотез, проверяемых против альтернатив общего вида <tex>H_{Ai} = \bar{H}_i, \: i=1,\ldots,m</tex>. Если нулевая гипотеза верна, будем писать <tex>H_i=0</tex> | + | Пусть <tex>H = \{H_i\}, \: i=1,\ldots,m</tex> — множество нулевых гипотез, проверяемых против альтернатив общего вида <tex>H_{Ai} = \bar{H}_i, \: i=1,\ldots,m</tex>. Если нулевая гипотеза верна, будем писать <tex>H_i=0,</tex> и <tex>H_i=1</tex> в противном случае. |
За <tex>p =\{p_1,\ldots,p_m\}</tex> обозначим множество [[Достигаемый уровень значимости|пи-величин]], полученных при проверке соответствующих гипотез <tex>H_i</tex> подходящими статистическими критериями. | За <tex>p =\{p_1,\ldots,p_m\}</tex> обозначим множество [[Достигаемый уровень значимости|пи-величин]], полученных при проверке соответствующих гипотез <tex>H_i</tex> подходящими статистическими критериями. | ||
- | Пусть <tex>M_0=\{i:\:H_i=0\}</tex> и <tex>M_1=\{i:\:H_i=1\}</tex> — неизвестные множества индексов верных и неверных нулевых гипотез, <tex>m_0=\left|M_0\right|</tex>, <tex>m_1=\left|M_1\right|</tex>, <tex>\left|M_0\cup M_1\right|=m</tex>. Количество отклонённых нулевых гипотез <tex>R</tex> и количество принятых <tex>W = m-R</tex> — наблюдаемые случайные величины, в то время как величины <tex>S | + | Пусть <tex>M_0=\{i:\:H_i=0\}</tex> и <tex>M_1=\{i:\:H_i=1\}</tex> — неизвестные множества индексов верных и неверных нулевых гипотез, <tex>m_0=\left|M_0\right|</tex>, <tex>m_1=\left|M_1\right|</tex>, <tex>\left|M_0\cup M_1\right|=m</tex>. Количество отклонённых нулевых гипотез <tex>R</tex> и количество принятых <tex>W = m-R</tex> — наблюдаемые случайные величины, в то время как величины <tex>S, \,T, \,U</tex> и <tex>V</tex> из приведённой ниже таблицы являются ненаблюдаемыми. |
<center> | <center> | ||
{| class = "standard" | {| class = "standard" | ||
Строка 44: | Строка 44: | ||
Хотя данная процедура позволяет ограничить вероятность ошибки первого рода, мощность её невелика, поскольку каждая из гипотез проверяется на уровне значимости <tex>\alpha/m</tex>. При достаточно больших <tex>m</tex> этот уровень настолько низок, что гипотезы будут отвергаться крайне неохотно. | Хотя данная процедура позволяет ограничить вероятность ошибки первого рода, мощность её невелика, поскольку каждая из гипотез проверяется на уровне значимости <tex>\alpha/m</tex>. При достаточно больших <tex>m</tex> этот уровень настолько низок, что гипотезы будут отвергаться крайне неохотно. | ||
- | ===Метод Холма=== | + | Существуют процедуры, которые равномерно превосходят по мощности процедуру, основанную на поправке Бонферрони, и не делают никаких дополнительных предположений. Таким образом, использование поправки Бонферрони нецелесообразно. |
+ | |||
+ | ===Метод Холма<ref name="holm">Holm, S. (1979). A simple sequentially rejective multiple test procedure. Scandinavian Journal of Statistics, 6(2), 65–70. http://www.jstor.org/stable/4615733</ref>=== | ||
Пусть <tex>p_{(1)}\leq \ldots \leq p_{(m)}</tex> — уровни значимости <tex>p_i,</tex> упорядоченные по неубыванию, <tex>H_{(1)}, \ldots, H_{(m)}</tex> — соответствующие <tex>p_{(i)}</tex> гипотезы. Процедура Холма определена следующим образом. | Пусть <tex>p_{(1)}\leq \ldots \leq p_{(m)}</tex> — уровни значимости <tex>p_i,</tex> упорядоченные по неубыванию, <tex>H_{(1)}, \ldots, H_{(m)}</tex> — соответствующие <tex>p_{(i)}</tex> гипотезы. Процедура Холма определена следующим образом. | ||
:Шаг 1. Если <tex>p_{(1)}\geq\alpha/m</tex>, принять гипотезы <tex>H_{(1)}, \ldots, H_{(m)}</tex> и остановиться. Иначе, если <tex>p_{(1)}>\alpha/m</tex>, отвергнуть гипотезу <tex>H_{(1)}</tex> и продолжить проверку оставшихся гипотез на уровне значимости <tex>\alpha/(m-1)</tex>. | :Шаг 1. Если <tex>p_{(1)}\geq\alpha/m</tex>, принять гипотезы <tex>H_{(1)}, \ldots, H_{(m)}</tex> и остановиться. Иначе, если <tex>p_{(1)}>\alpha/m</tex>, отвергнуть гипотезу <tex>H_{(1)}</tex> и продолжить проверку оставшихся гипотез на уровне значимости <tex>\alpha/(m-1)</tex>. | ||
:Шаг 2. Если <tex>p_{(2)}\geq\alpha/(m-1)</tex>, принять гипотезы <tex>H_{(2)}, \ldots, H_{(m)}</tex> и остановиться. Иначе, если <tex>p_{(2)}>\alpha/(m-1)</tex>, отвергнуть гипотезу <tex>H_{(2)}</tex> и продолжить проверку оставшихся гипотез на уровне значимости <tex>\alpha/(m-2)</tex>. | :Шаг 2. Если <tex>p_{(2)}\geq\alpha/(m-1)</tex>, принять гипотезы <tex>H_{(2)}, \ldots, H_{(m)}</tex> и остановиться. Иначе, если <tex>p_{(2)}>\alpha/(m-1)</tex>, отвергнуть гипотезу <tex>H_{(2)}</tex> и продолжить проверку оставшихся гипотез на уровне значимости <tex>\alpha/(m-2)</tex>. | ||
:И т.д. | :И т.д. | ||
- | Процедура обеспечивает <tex>FWER\leq\alpha</tex> при любом характере зависимости между <tex>p_i.</tex> | + | Процедура обеспечивает <tex>\operator{FWER}\leq\alpha</tex> при любом характере зависимости между <tex>p_i.</tex> |
===Метод Хохберга=== | ===Метод Хохберга=== |
Версия 18:16, 9 ноября 2011
FWER (familywise error rate, групповая вероятность ошибки (первого рода)) — одна из мер, обобщающих ошибку первого рода, рассматриваемую при проверке статистических гипотез, на многомерный случай задачи множественной проверки гипотез. Величина определена как вероятность совершить хотя бы одну ошибку первого рода.
Содержание |
Обозначения
Пусть — множество нулевых гипотез, проверяемых против альтернатив общего вида . Если нулевая гипотеза верна, будем писать и в противном случае.
За обозначим множество пи-величин, полученных при проверке соответствующих гипотез подходящими статистическими критериями.
Пусть и — неизвестные множества индексов верных и неверных нулевых гипотез, , , . Количество отклонённых нулевых гипотез и количество принятых — наблюдаемые случайные величины, в то время как величины и из приведённой ниже таблицы являются ненаблюдаемыми.
Число принятых гипотез | Число отвергнутых гипотез | Всего | |
---|---|---|---|
Число верных гипотез | |||
Число неверных гипотез | |||
Всего |
Задача состоит в том, чтобы выбрать метод, допускающий минимальное число ложных отклонений гипотез и ложных принятий .
По определению . Контроль над на фиксированном уровне означает, что выполняется неравенство .
Методы контроля FWER
Поправка Бонферрони
Метод Бонферрони, самый известный способ решения задачи множественной проверки гипотез, утверждает, что для контроля над на уровне достаточно, чтобы отвергались те и только те гипотезы , для которых . Соответствующие модифицированные достигаемые уровни значимости вычисляются по формуле
- .
Контроль над обеспечивается по неравенству Буля:
Данное неравенство выполняется при любых , безо всяких ограничений на характер зависимости между ними.
Хотя данная процедура позволяет ограничить вероятность ошибки первого рода, мощность её невелика, поскольку каждая из гипотез проверяется на уровне значимости . При достаточно больших этот уровень настолько низок, что гипотезы будут отвергаться крайне неохотно.
Существуют процедуры, которые равномерно превосходят по мощности процедуру, основанную на поправке Бонферрони, и не делают никаких дополнительных предположений. Таким образом, использование поправки Бонферрони нецелесообразно.
Метод Холма[1]
Пусть — уровни значимости упорядоченные по неубыванию, — соответствующие гипотезы. Процедура Холма определена следующим образом.
- Шаг 1. Если , принять гипотезы и остановиться. Иначе, если , отвергнуть гипотезу и продолжить проверку оставшихся гипотез на уровне значимости .
- Шаг 2. Если , принять гипотезы и остановиться. Иначе, если , отвергнуть гипотезу и продолжить проверку оставшихся гипотез на уровне значимости .
- И т.д.
Процедура обеспечивает при любом характере зависимости между
Метод Хохберга
Метод Шидака
minP
Перестановочные методы
Метод Хоммеля
Последовательная проверка
Контроль FWER для иерархических семейств гипотез
Связь с другими мерами ошибки первого рода
Ссылки
- Familywise error rate — статья из английской Википедии.