Метод Бенджамини-Иекутиели
Материал из MachineLearning.
(→Замечание) |
|||
(4 промежуточные версии не показаны) | |||
Строка 1: | Строка 1: | ||
- | '''Метод Бенджамини-Иекутиели''' — один из нисходящих методов контроля ожидаемой доли ложных отклонений гипотез ([[FDR]]), который, в отличии от [[Метод Бенджамини-Хохберга|метода Бенджамини-Хохберга]], не накладывает дополнительных ограничений на статистики гипотез <tex> T_i</tex>. | + | '''Метод Бенджамини-Иекутиели'''<ref name="mby">Benjamini, Yoav; Yekutieli, Daniel (2001). [http://www.math.tau.ac.il/~ybenja/MyPapers/benjamini_yekutieli_ANNSTAT2001.pdf "The control of the false discovery rate in multiple testing under dependency"]. Annals of Statistics 29 (4): 1165–1188. </ref> — один из нисходящих методов контроля ожидаемой доли ложных отклонений гипотез ([[FDR]]), который, в отличии от [[Метод Бенджамини-Хохберга|метода Бенджамини-Хохберга]], не накладывает дополнительных ограничений на статистики гипотез <tex> T_i</tex>. |
== Определение == | == Определение == | ||
Строка 13: | Строка 13: | ||
::<tex>\alpha_1 = \frac{\alpha}{mc}\:,\:\dots\:,\:\alpha_i = \frac{i\alpha}{mc}\:, \:\dots\:, \:\alpha_m = \frac{\alpha}{c}</tex>, | ::<tex>\alpha_1 = \frac{\alpha}{mc}\:,\:\dots\:,\:\alpha_i = \frac{i\alpha}{mc}\:, \:\dots\:, \:\alpha_m = \frac{\alpha}{c}</tex>, | ||
где <tex>c = \sum_{i=1}^m\frac{1}{i}</tex> | где <tex>c = \sum_{i=1}^m\frac{1}{i}</tex> | ||
+ | |||
+ | Пусть <tex>p_{(1)}\leq \ldots \leq p_{(m)}</tex> — уровни значимости <tex>p_i</tex>, упорядоченные по неубыванию, <tex>H_{(1)}, \ldots, H_{(m)}</tex> — соответствующие <tex>p_{(i)}</tex> гипотезы. Процедура метода Бенджамини-Иекутиели определена следующим образом. | ||
+ | : Шаг 1. Если <tex>p_{(1)}\geq\frac{\alpha}{mc}</tex>, принять гипотезы <tex>H_{(1)}, \ldots, H_{(m)}</tex> и остановиться. Иначе, если <tex>p_{(1)}<\frac{\alpha}{mc}</tex>, отвергнуть гипотезу <tex>H_{(1)}</tex> и продолжить проверку оставшихся гипотез на уровне значимости <tex>\frac{2\alpha}{mc}</tex>. | ||
+ | : Шаг 2. Если <tex>p_{(2)}\geq\frac{2\alpha}{mc}</tex>, принять гипотезы <tex>H_{(2)}, \ldots, H_{(m)}</tex> и остановиться. Иначе, если <tex>p_{(2)}<\frac{2\alpha}{mc}</tex>, отвергнуть гипотезу <tex>H_{(2)}</tex> и продолжить проверку оставшихся гипотез на уровне значимости <tex>\frac{3\alpha}{mc}</tex>. | ||
+ | : И т.д. | ||
Если обозначить число верных гипотез как <tex>\:m_0</tex>, то метод Бенджамини-Иекутиели обеспечивает контроль над FDR на уровне <tex>\frac{m_0}{m}\alpha \leq \alpha</tex> при любых <tex> p_i</tex> и <tex>T_i</tex>. | Если обозначить число верных гипотез как <tex>\:m_0</tex>, то метод Бенджамини-Иекутиели обеспечивает контроль над FDR на уровне <tex>\frac{m_0}{m}\alpha \leq \alpha</tex> при любых <tex> p_i</tex> и <tex>T_i</tex>. | ||
Строка 23: | Строка 28: | ||
===Замечание=== | ===Замечание=== | ||
- | Пусть статистики гипотез <tex> T_i</tex> независимы или выполняется следующее свойство (PRDS on <tex>T_i,\: i \in M_0</tex>): | + | Пусть статистики гипотез <tex> T_i</tex> независимы или выполняется следующее свойство (PRDS<ref name="mby"> </ref> on <tex>T_i,\: i \in M_0</tex>): |
::<tex>\operator{P}(X\in D|T_i=x) </tex> не убывает по <tex>x\:\forall i\in M_0</tex>, | ::<tex>\operator{P}(X\in D|T_i=x) </tex> не убывает по <tex>x\:\forall i\in M_0</tex>, | ||
где <tex>M_0</tex> - множество индексов верных гипотез, <tex>D</tex> - произвольное возрастающее множество, то есть, такое, что из <tex>x\in D</tex> и <tex>y \geq x</tex> следует <tex>y\in D</tex>. | где <tex>M_0</tex> - множество индексов верных гипотез, <tex>D</tex> - произвольное возрастающее множество, то есть, такое, что из <tex>x\in D</tex> и <tex>y \geq x</tex> следует <tex>y\in D</tex>. | ||
Тогда можно положить константу <tex>c</tex> равной единице и получить [[метод Бенджамини-Хохберга]]. Другими словами [[метод Бенджамини-Хохберга]] - частный случай метода Бенджамини-Иекутиели. | Тогда можно положить константу <tex>c</tex> равной единице и получить [[метод Бенджамини-Хохберга]]. Другими словами [[метод Бенджамини-Хохберга]] - частный случай метода Бенджамини-Иекутиели. | ||
+ | |||
== Пример == | == Пример == | ||
Строка 91: | Строка 97: | ||
== Реализации == | == Реализации == | ||
- | |||
- | |||
- | == | + | * MATLAB: Benjamini and Hochberg/Yekutieli Procedure for Controlling False Discovery Rate <ref name="bhypcfdr"> Benjamini and Hochberg/Yekutieli Procedure for Controlling False Discovery Rate [http://www.mathworks.com/matlabcentral/fileexchange/27418-benjamini-hochbergyekutieli-procedure-for-controlling-false-discovery-rate ]</ref> - реализация на MathWorks.com |
+ | * R: функция p.adjust<ref name="padj"> http://www.inside-r.org/r-doc/stats/p.adjust</ref> (с параметром <code>method="BY"</code>) из стандартного пакета <code>stats</code> позволяет получить модифицированные уровни значимости с учетом поправки метода Бенджамини-Иекутиели. | ||
- | + | == Ссылки == | |
+ | <references /> | ||
== См. также == | == См. также == |
Текущая версия
Метод Бенджамини-Иекутиели[1] — один из нисходящих методов контроля ожидаемой доли ложных отклонений гипотез (FDR), который, в отличии от метода Бенджамини-Хохберга, не накладывает дополнительных ограничений на статистики гипотез .
Содержание |
Определение
Пусть — семейство гипотез, а — соответствующие им достигаемые уровни значимости. Обозначим за - число отвергнутых гипотез, а за - число неверно отвергнутых гипотез, т.е. число ошибок первого рода.
Ожидаемая доля ложных отклонений гипотез, или FDR, определяется следующим образом
Контроль над FDR на уровне означает, что
Метод Бенджамини-Иекутиели
Это нисходящая процедура(по аналогии с методом Холма и методом Бенджамини-Хохберга) со следующими уровнями значимости
- ,
где
Пусть — уровни значимости , упорядоченные по неубыванию, — соответствующие гипотезы. Процедура метода Бенджамини-Иекутиели определена следующим образом.
- Шаг 1. Если , принять гипотезы и остановиться. Иначе, если , отвергнуть гипотезу и продолжить проверку оставшихся гипотез на уровне значимости .
- Шаг 2. Если , принять гипотезы и остановиться. Иначе, если , отвергнуть гипотезу и продолжить проверку оставшихся гипотез на уровне значимости .
- И т.д.
Если обозначить число верных гипотез как , то метод Бенджамини-Иекутиели обеспечивает контроль над FDR на уровне при любых и .
Альтернативная постановка
Переходим к модифицированным достигаемым уровням значимости:
- ,
где - -ый член вариационного ряда достигаемых уровней значимости
Замечание
Пусть статистики гипотез независимы или выполняется следующее свойство (PRDS[1] on ):
- не убывает по ,
где - множество индексов верных гипотез, - произвольное возрастающее множество, то есть, такое, что из и следует .
Тогда можно положить константу равной единице и получить метод Бенджамини-Хохберга. Другими словами метод Бенджамини-Хохберга - частный случай метода Бенджамини-Иекутиели.
Пример
для проверки используем одновыборочный критерий Стьюдента.
С поправкой Холма(Метод Холма):
Верных Неверных Всего Принятых 150 24 174 Отвергнутых 0 26 26 Всего 150 50 200
С методом Бенджамини-Иекутиели:
Верных Неверных Всего Принятых 150 10 160 Отвергнутых 0 40 40 Всего 150 50 200
Реализации
- MATLAB: Benjamini and Hochberg/Yekutieli Procedure for Controlling False Discovery Rate [1] - реализация на MathWorks.com
- R: функция p.adjust[1] (с параметром
method="BY"
) из стандартного пакетаstats
позволяет получить модифицированные уровни значимости с учетом поправки метода Бенджамини-Иекутиели.
Ссылки