Метод Бенджамини-Иекутиели

Материал из MachineLearning.

(Различия между версиями)

Текущая версия

Метод Бенджамини-Иекутиели^[1] — один из нисходящих методов контроля ожидаемой доли ложных отклонений гипотез (FDR), который, в отличии от метода Бенджамини-Хохберга, не накладывает дополнительных ограничений на статистики гипотез $T_i$ .

Определение

Пусть $H_{1},...,H_{m}$ — семейство гипотез, а $p_{1},...,p_{m}$ — соответствующие им достигаемые уровни значимости. Обозначим за $R$ - число отвергнутых гипотез, а за $V$ - число неверно отвергнутых гипотез, т.е. число ошибок первого рода.

Ожидаемая доля ложных отклонений гипотез, или FDR, определяется следующим образом

$FDR\:=\: \operator{E}\left(\frac{V}{R}[R > 0]\right)$

Контроль над FDR на уровне $\alpha$ означает, что

$FDR\:=\: \operator{E}\left(\frac{V}{R}[R > 0]\right) \leq \alpha$

Метод Бенджамини-Иекутиели

Это нисходящая процедура(по аналогии с методом Холма и методом Бенджамини-Хохберга) со следующими уровнями значимости

$\alpha_1 = \frac{\alpha}{mc}\:,\:\dots\:,\:\alpha_i = \frac{i\alpha}{mc}\:, \:\dots\:, \:\alpha_m = \frac{\alpha}{c}$ ,

где $c = \sum_{i=1}^m\frac{1}{i}$

Пусть $p_{(1)}\leq \ldots \leq p_{(m)}$ — уровни значимости $p_i$ , упорядоченные по неубыванию, $H_{(1)}, \ldots, H_{(m)}$ — соответствующие $p_{(i)}$ гипотезы. Процедура метода Бенджамини-Иекутиели определена следующим образом.

Шаг 1. Если $p_{(1)}\geq\frac{\alpha}{mc}$ , принять гипотезы $H_{(1)}, \ldots, H_{(m)}$ и остановиться. Иначе, если $p_{(1)}<\frac{\alpha}{mc}$ , отвергнуть гипотезу $H_{(1)}$ и продолжить проверку оставшихся гипотез на уровне значимости $\frac{2\alpha}{mc}$ .

Шаг 2. Если $p_{(2)}\geq\frac{2\alpha}{mc}$ , принять гипотезы $H_{(2)}, \ldots, H_{(m)}$ и остановиться. Иначе, если $p_{(2)}<\frac{2\alpha}{mc}$ , отвергнуть гипотезу $H_{(2)}$ и продолжить проверку оставшихся гипотез на уровне значимости $\frac{3\alpha}{mc}$ .

И т.д.

Если обозначить число верных гипотез как $\:m_0$ , то метод Бенджамини-Иекутиели обеспечивает контроль над FDR на уровне $\frac{m_0}{m}\alpha \leq \alpha$ при любых $p_i$ и $T_i$ .

Альтернативная постановка

Переходим к модифицированным достигаемым уровням значимости:

$\tilde p_{(i)}\: =\: \min\left(1,\: \max\left(\frac{mp_{(i)}c}{i}, \:\tilde p_{(i-1)}\right)\right)$ ,

где $p_{(i)}$ - $i$ -ый член вариационного ряда достигаемых уровней значимости

$p_{(1)} \: \leq\: p_{(2)}\: \leq \: \dots \: \leq p_{(m)}$

Замечание

Пусть статистики гипотез $T_i$ независимы или выполняется следующее свойство (PRDS^[1] on $T_i,\: i \in M_0$ ):

$\operator{P}(X\in D|T_i=x)$ не убывает по $x\:\forall i\in M_0$ ,

где $M_0$ - множество индексов верных гипотез, $D$ - произвольное возрастающее множество, то есть, такое, что из $x\in D$ и $y \geq x$ следует $y\in D$ .

Тогда можно положить константу $c$ равной единице и получить метод Бенджамини-Хохберга. Другими словами метод Бенджамини-Хохберга - частный случай метода Бенджамини-Иекутиели.

Пример

$n=20, \;m=200, \;m_0 = 150;$

$X_{ij} \sim N(0,1), \;i=1,\ldots,m_0, \;j=1,\ldots,n;$

$X_{ij} \sim N(1,1),\; i=m_0+1,\ldots,m, \;j=1,\ldots,n;$

$H_i: EX_{ij} = 0, \;H_i': EX_{ij} \ne 0;$

для проверки используем одновыборочный критерий Стьюдента.

С поправкой Холма(Метод Холма):

	Верных $H_i$	Неверных $H_i$	Всего
Принятых $H_i$	150	24	174
Отвергнутых $H_i$	0	26	26
Всего	150	50	200

С методом Бенджамини-Иекутиели:

	Верных $H_i$	Неверных $H_i$	Всего
Принятых $H_i$	150	10	160
Отвергнутых $H_i$	0	40	40
Всего	150	50	200

Реализации

MATLAB: Benjamini and Hochberg/Yekutieli Procedure for Controlling False Discovery Rate ^[1] - реализация на MathWorks.com
R: функция p.adjust^[1] (с параметром method="BY") из стандартного пакета stats позволяет получить модифицированные уровни значимости с учетом поправки метода Бенджамини-Иекутиели.

Ссылки

См. также

Метод Холма

Метод Бенджамини-Хохберга

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%91%D0%B5%D0%BD%D0%B4%D0%B6%D0%B0%D0%BC%D0%B8%D0%BD%D0%B8-%D0%98%D0%B5%D0%BA%D1%83%D1%82%D0%B8%D0%B5%D0%BB%D0%B8»

Категории: Прикладная статистика | Множественная проверка гипотез

@@ Строка 1: / Строка 1: @@
-'''Метод Бенджамини-Иекутиели''' — один из нисходящих методов контроля ожидаемой доли ложных отклонений гипотез ([[FDR]]), который, в отличии от [[Метод Бенджамини-Хохберга|метода Бенджамини-Хохберга]], не накладывает дополнительных ограничений на статистики гипотез <tex> T_i</tex>.
+'''Метод Бенджамини-Иекутиели'''<ref name="mby">Benjamini, Yoav; Yekutieli, Daniel (2001). [http://www.math.tau.ac.il/~ybenja/MyPapers/benjamini_yekutieli_ANNSTAT2001.pdf "The control of the false discovery rate in multiple testing under dependency"]. Annals of Statistics 29 (4): 1165–1188. </ref> — один из нисходящих методов контроля ожидаемой доли ложных отклонений гипотез ([[FDR]]), который, в отличии от [[Метод Бенджамини-Хохберга|метода Бенджамини-Хохберга]], не накладывает дополнительных ограничений на статистики гипотез <tex> T_i</tex>.
 == Определение ==
@@ Строка 28: / Строка 28: @@
 ===Замечание===
-Пусть статистики гипотез <tex> T_i</tex> независимы или выполняется следующее свойство (PRDS on <tex>T_i,\: i \in M_0</tex>):
+Пусть статистики гипотез <tex> T_i</tex> независимы или выполняется следующее свойство (PRDS<ref name="mby"> </ref> on <tex>T_i,\: i \in M_0</tex>):
 ::<tex>\operator{P}(X\in D|T_i=x) </tex> не убывает по <tex>x\:\forall i\in M_0</tex>,
 где <tex>M_0</tex> - множество индексов верных гипотез, <tex>D</tex> - произвольное возрастающее множество, то есть, такое, что из <tex>x\in D</tex> и <tex>y \geq x</tex> следует <tex>y\in D</tex>.
@@ Строка 97: / Строка 97: @@
 == Реализации ==
-* MATLAB: [http://www.mathworks.com/matlabcentral/fileexchange/27418-benjamini-hochbergyekutieli-procedure-for-controlling-false-discovery-rate Benjamini and Hochberg/Yekutieli Procedure for Controlling False Discovery Rate] - реализация на MathWorks.com
-* R: функция [http://www.inside-r.org/r-doc/stats/p.adjust <code>p.adjust</code>] (с параметром <code>method="BY"</code>) из стандартного пакета <code>stats</code> позволяет получить модифицированные уровни значимости с учетом поправки метода Бенджамини-Иекуитеил.
-== Ссылки ==
+* MATLAB: Benjamini and Hochberg/Yekutieli Procedure for Controlling False Discovery Rate <ref name="bhypcfdr"> Benjamini and Hochberg/Yekutieli Procedure for Controlling False Discovery Rate [http://www.mathworks.com/matlabcentral/fileexchange/27418-benjamini-hochbergyekutieli-procedure-for-controlling-false-discovery-rate ]</ref> - реализация на MathWorks.com
+* R: функция p.adjust<ref name="padj"> http://www.inside-r.org/r-doc/stats/p.adjust</ref> (с параметром <code>method="BY"</code>) из стандартного пакета <code>stats</code> позволяет получить модифицированные уровни значимости с учетом поправки метода Бенджамини-Иекутиели.
-* Benjamini, Yoav; Yekutieli, Daniel (2001). [http://www.math.tau.ac.il/~ybenja/MyPapers/benjamini_yekutieli_ANNSTAT2001.pdf|"The control of the false discovery rate in multiple testing under dependency"]. Annals of Statistics 29 (4): 1165–1188. [http://dx.doi.org/10.1214%2Faos%2F1013699998 doi]. MR 1869245.
+== Ссылки ==
+<references />
 == См. также ==

Метод Бенджамини-Иекутиели

Материал из MachineLearning.

Текущая версия

Содержание

Определение

Метод Бенджамини-Иекутиели

Альтернативная постановка

Замечание

Пример

Реализации

Ссылки

См. также

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты