Метод Бенджамини-Иекутиели

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: '''Метод Бенджамини-Иекутиели''' — один из нисходящих методов контроля ожидаемой доли ложных отклонен...)
(Замечание)
 
(5 промежуточных версий не показаны.)
Строка 1: Строка 1:
-
'''Метод Бенджамини-Иекутиели''' — один из нисходящих методов контроля ожидаемой доли ложных отклонений гипотез ([[FDR]]), который в отличии от [[Метод Бенджамини-Хохберга|метода Бенджамини-Хохберга]] не накладывает дополнительных ограничений на статистики гипотез <tex> T_i</tex>.
+
'''Метод Бенджамини-Иекутиели'''<ref name="mby">Benjamini, Yoav; Yekutieli, Daniel (2001). [http://www.math.tau.ac.il/~ybenja/MyPapers/benjamini_yekutieli_ANNSTAT2001.pdf "The control of the false discovery rate in multiple testing under dependency"]. Annals of Statistics 29 (4): 1165–1188. </ref> — один из нисходящих методов контроля ожидаемой доли ложных отклонений гипотез ([[FDR]]), который, в отличии от [[Метод Бенджамини-Хохберга|метода Бенджамини-Хохберга]], не накладывает дополнительных ограничений на статистики гипотез <tex> T_i</tex>.
== Определение ==
== Определение ==
Строка 13: Строка 13:
::<tex>\alpha_1 = \frac{\alpha}{mc}\:,\:\dots\:,\:\alpha_i = \frac{i\alpha}{mc}\:, \:\dots\:, \:\alpha_m = \frac{\alpha}{c}</tex>,
::<tex>\alpha_1 = \frac{\alpha}{mc}\:,\:\dots\:,\:\alpha_i = \frac{i\alpha}{mc}\:, \:\dots\:, \:\alpha_m = \frac{\alpha}{c}</tex>,
где <tex>c = \sum_{i=1}^m\frac{1}{i}</tex>
где <tex>c = \sum_{i=1}^m\frac{1}{i}</tex>
 +
 +
Пусть <tex>p_{(1)}\leq \ldots \leq p_{(m)}</tex> — уровни значимости <tex>p_i</tex>, упорядоченные по неубыванию, <tex>H_{(1)}, \ldots, H_{(m)}</tex> — соответствующие <tex>p_{(i)}</tex> гипотезы. Процедура метода Бенджамини-Иекутиели определена следующим образом.
 +
: Шаг 1. Если <tex>p_{(1)}\geq\frac{\alpha}{mc}</tex>, принять гипотезы <tex>H_{(1)}, \ldots, H_{(m)}</tex> и остановиться. Иначе, если <tex>p_{(1)}<\frac{\alpha}{mc}</tex>, отвергнуть гипотезу <tex>H_{(1)}</tex> и продолжить проверку оставшихся гипотез на уровне значимости <tex>\frac{2\alpha}{mc}</tex>.
 +
: Шаг 2. Если <tex>p_{(2)}\geq\frac{2\alpha}{mc}</tex>, принять гипотезы <tex>H_{(2)}, \ldots, H_{(m)}</tex> и остановиться. Иначе, если <tex>p_{(2)}<\frac{2\alpha}{mc}</tex>, отвергнуть гипотезу <tex>H_{(2)}</tex> и продолжить проверку оставшихся гипотез на уровне значимости <tex>\frac{3\alpha}{mc}</tex>.
 +
: И т.д.
Если обозначить число верных гипотез как <tex>\:m_0</tex>, то метод Бенджамини-Иекутиели обеспечивает контроль над FDR на уровне <tex>\frac{m_0}{m}\alpha \leq \alpha</tex> при любых <tex> p_i</tex> и <tex>T_i</tex>.
Если обозначить число верных гипотез как <tex>\:m_0</tex>, то метод Бенджамини-Иекутиели обеспечивает контроль над FDR на уровне <tex>\frac{m_0}{m}\alpha \leq \alpha</tex> при любых <tex> p_i</tex> и <tex>T_i</tex>.
Строка 23: Строка 28:
===Замечание===
===Замечание===
-
Пусть статистики гипотез <tex> T_i</tex> независимы или выполняется следующее свойство (PRDS on <tex>T_i,\: i \in M_0</tex>):
+
Пусть статистики гипотез <tex> T_i</tex> независимы или выполняется следующее свойство (PRDS<ref name="mby"> </ref> on <tex>T_i,\: i \in M_0</tex>):
::<tex>\operator{P}(X\in D|T_i=x) </tex> не убывает по <tex>x\:\forall i\in M_0</tex>,
::<tex>\operator{P}(X\in D|T_i=x) </tex> не убывает по <tex>x\:\forall i\in M_0</tex>,
где <tex>M_0</tex> - множество индексов верных гипотез, <tex>D</tex> - произвольное возрастающее множество, то есть, такое, что из <tex>x\in D</tex> и <tex>y \geq x</tex> следует <tex>y\in D</tex>.
где <tex>M_0</tex> - множество индексов верных гипотез, <tex>D</tex> - произвольное возрастающее множество, то есть, такое, что из <tex>x\in D</tex> и <tex>y \geq x</tex> следует <tex>y\in D</tex>.
Тогда можно положить константу <tex>c</tex> равной единице и получить [[метод Бенджамини-Хохберга]]. Другими словами [[метод Бенджамини-Хохберга]] - частный случай метода Бенджамини-Иекутиели.
Тогда можно положить константу <tex>c</tex> равной единице и получить [[метод Бенджамини-Хохберга]]. Другими словами [[метод Бенджамини-Хохберга]] - частный случай метода Бенджамини-Иекутиели.
 +
== Пример ==
== Пример ==
Строка 91: Строка 97:
== Реализации ==
== Реализации ==
-
* MATLAB: [http://www.mathworks.com/matlabcentral/fileexchange/27418-benjamini-hochbergyekutieli-procedure-for-controlling-false-discovery-rate Benjamini and Hochberg/Yekutieli Procedure for Controlling False Discovery Rate] - реализация на MathWorks.com
 
-
* R: функция [http://www.inside-r.org/r-doc/stats/p.adjust <code>p.adjust</code>] (с параметром <code>method="BY"</code>) из стандартного пакета <code>stats</code> позволяет получить модифицированные уровни значимости с учетом поправки метода Бенджамини-Иекуитеил.
 
-
== Ссылки ==
+
* MATLAB: Benjamini and Hochberg/Yekutieli Procedure for Controlling False Discovery Rate <ref name="bhypcfdr"> Benjamini and Hochberg/Yekutieli Procedure for Controlling False Discovery Rate [http://www.mathworks.com/matlabcentral/fileexchange/27418-benjamini-hochbergyekutieli-procedure-for-controlling-false-discovery-rate ]</ref> - реализация на MathWorks.com
 +
* R: функция p.adjust<ref name="padj"> http://www.inside-r.org/r-doc/stats/p.adjust</ref> (с параметром <code>method="BY"</code>) из стандартного пакета <code>stats</code> позволяет получить модифицированные уровни значимости с учетом поправки метода Бенджамини-Иекутиели.
-
* Benjamini, Yoav; Yekutieli, Daniel (2001). [http://www.math.tau.ac.il/~ybenja/MyPapers/benjamini_yekutieli_ANNSTAT2001.pdf|"The control of the false discovery rate in multiple testing under dependency"]. Annals of Statistics 29 (4): 1165–1188. [http://dx.doi.org/10.1214%2Faos%2F1013699998 doi]. MR 1869245.
+
== Ссылки ==
 +
<references />
== См. также ==
== См. также ==

Текущая версия

Метод Бенджамини-Иекутиели[1] — один из нисходящих методов контроля ожидаемой доли ложных отклонений гипотез (FDR), который, в отличии от метода Бенджамини-Хохберга, не накладывает дополнительных ограничений на статистики гипотез  T_i.

Содержание

Определение

Пусть H_{1},...,H_{m} — семейство гипотез, а p_{1},...,p_{m} — соответствующие им достигаемые уровни значимости. Обозначим за R - число отвергнутых гипотез, а за V - число неверно отвергнутых гипотез, т.е. число ошибок первого рода.

Ожидаемая доля ложных отклонений гипотез, или FDR, определяется следующим образом

FDR\:=\: \operator{E}\left(\frac{V}{R}[R > 0]\right)

Контроль над FDR на уровне \alpha означает, что

FDR\:=\: \operator{E}\left(\frac{V}{R}[R > 0]\right) \leq \alpha

Метод Бенджамини-Иекутиели

Это нисходящая процедура(по аналогии с методом Холма и методом Бенджамини-Хохберга) со следующими уровнями значимости

\alpha_1 = \frac{\alpha}{mc}\:,\:\dots\:,\:\alpha_i = \frac{i\alpha}{mc}\:, \:\dots\:, \:\alpha_m = \frac{\alpha}{c},

где c = \sum_{i=1}^m\frac{1}{i}

Пусть p_{(1)}\leq \ldots \leq p_{(m)} — уровни значимости p_i, упорядоченные по неубыванию, H_{(1)}, \ldots, H_{(m)} — соответствующие p_{(i)} гипотезы. Процедура метода Бенджамини-Иекутиели определена следующим образом.

Шаг 1. Если p_{(1)}\geq\frac{\alpha}{mc}, принять гипотезы H_{(1)}, \ldots, H_{(m)} и остановиться. Иначе, если p_{(1)}<\frac{\alpha}{mc}, отвергнуть гипотезу H_{(1)} и продолжить проверку оставшихся гипотез на уровне значимости \frac{2\alpha}{mc}.
Шаг 2. Если p_{(2)}\geq\frac{2\alpha}{mc}, принять гипотезы H_{(2)}, \ldots, H_{(m)} и остановиться. Иначе, если p_{(2)}<\frac{2\alpha}{mc}, отвергнуть гипотезу H_{(2)} и продолжить проверку оставшихся гипотез на уровне значимости \frac{3\alpha}{mc}.
И т.д.

Если обозначить число верных гипотез как \:m_0, то метод Бенджамини-Иекутиели обеспечивает контроль над FDR на уровне \frac{m_0}{m}\alpha \leq \alpha при любых  p_i и T_i.

Альтернативная постановка

Переходим к модифицированным достигаемым уровням значимости:

\tilde p_{(i)}\: =\: \min\left(1,\: \max\left(\frac{mp_{(i)}c}{i}, \:\tilde p_{(i-1)}\right)\right),

где p_{(i)} - i-ый член вариационного ряда достигаемых уровней значимости

p_{(1)} \: \leq\:  p_{(2)}\:  \leq \: \dots \: \leq p_{(m)}

Замечание

Пусть статистики гипотез  T_i независимы или выполняется следующее свойство (PRDS[1] on T_i,\: i \in M_0):

\operator{P}(X\in D|T_i=x) не убывает по x\:\forall i\in M_0,

где M_0 - множество индексов верных гипотез, D - произвольное возрастающее множество, то есть, такое, что из x\in D и y \geq x следует y\in D.

Тогда можно положить константу c равной единице и получить метод Бенджамини-Хохберга. Другими словами метод Бенджамини-Хохберга - частный случай метода Бенджамини-Иекутиели.

Пример

n=20, \;m=200, \;m_0 = 150;

X_{ij} \sim N(0,1), \;i=1,\ldots,m_0, \;j=1,\ldots,n;

X_{ij} \sim N(1,1),\; i=m_0+1,\ldots,m, \;j=1,\ldots,n;

H_i: EX_{ij} = 0, \;H_i': EX_{ij} \ne 0;

для проверки используем одновыборочный критерий Стьюдента.

С поправкой Холма(Метод Холма):

Верных H_i Неверных H_i Всего
Принятых H_i 150 24 174
Отвергнутых H_i 0 26 26
Всего 150 50 200


С методом Бенджамини-Иекутиели:

Верных H_i Неверных H_i Всего
Принятых H_i 150 10 160
Отвергнутых H_i 0 40 40
Всего 150 50 200

Реализации

  • MATLAB: Benjamini and Hochberg/Yekutieli Procedure for Controlling False Discovery Rate [1] - реализация на MathWorks.com
  • R: функция p.adjust[1] (с параметром method="BY") из стандартного пакета stats позволяет получить модифицированные уровни значимости с учетом поправки метода Бенджамини-Иекутиели.

Ссылки


См. также

Метод Холма

Метод Бенджамини-Хохберга

Личные инструменты