False discovery rate

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Создание страницы FDR)
м
Строка 25: Строка 25:
-
'''[[Метод Бенджамини-Хохберга|Метод Бенджамини-Хохберга]]''' &mdash частный случай метода Бенджамини-Иекутиели.
+
'''[[Метод Бенджамини-Хохберга|Метод Бенджамини-Хохберга]]''' частный случай метода Бенджамини-Иекутиели.
Обеспечивает контроль <tex>FDR</tex> при условии независимости статистик <tex>T_i</tex>. Или при условии <tex>PRDS</tex> &mdash positive regression dependence on subset<ref name="prds"> Benjamini, Y., & Yekutieli, D. (2001). [http://projecteuclid.org/euclid.aos/1013699998 The control of the false discovery rate in multiple testing under dependency]. Annals of Statistics, 29(4), 1165–1188. </ref> on <tex>T_i,\: i \in M_0</tex>:
Обеспечивает контроль <tex>FDR</tex> при условии независимости статистик <tex>T_i</tex>. Или при условии <tex>PRDS</tex> &mdash positive regression dependence on subset<ref name="prds"> Benjamini, Y., & Yekutieli, D. (2001). [http://projecteuclid.org/euclid.aos/1013699998 The control of the false discovery rate in multiple testing under dependency]. Annals of Statistics, 29(4), 1165–1188. </ref> on <tex>T_i,\: i \in M_0</tex>:

Версия 22:11, 10 февраля 2014

FDR (также False discovery rate, Ожидаемая доля ложных отклонений) — одна из мер, обобщающих ошибку первого рода, рассматриваемую при проверке статистических гипотез, на многомерный случай задачи множественной проверки гипотез. Величина определена как математическое ожидание доли ошибок среди отвергнутых гипотез.

Содержание

Определение

Пусть H_{1},...,H_{m} — семейство нулевых гипотез, а p_{1},...,p_{m} — соответствующие им достигаемые уровни значимости на статистиках T_{1},...,T_{m} против альтернатив H'_{1},...,H'_{m}. Обозначим за R - число отвергнутых гипотез, а за V - число неверно отвергнутых гипотез, т.е. число ошибок первого рода.

Ожидаемая доля ложных отклонений гипотез, или FDR, определяется следующим образом

FDR\:=\: \operator{E}\left(\frac{V}{R}[R > 0]\right)

Контроль над FDR на уровне \alpha означает, что

FDR\:=\: \operator{E}\left(\frac{V}{R}[R > 0]\right) \leq \alpha

Связь с FWER

Для любой процедуры множественной проверки гипотез FDR ≤ FWER.

Когда FDR = FWR?

Допустим все гипотезы H_{1},...,H_{m} верны. V = R Тогда:

\frac{V}{R}[R > 0] = 0 если V=R=0 с вероятностью P(V=0) \frac{V}{R}[R > 0] = 1 если V=R=1, V=R=2, ..., V=R=m с вероятностью </tex>P\(V\geq1\)</tex>

Методы контроля

Метод Бенджамини-Иекутиели


Метод Бенджамини-Хохберга — частный случай метода Бенджамини-Иекутиели.

Обеспечивает контроль FDR при условии независимости статистик T_i. Или при условии PRDS &mdash positive regression dependence on subset[1] on T_i,\: i \in M_0:

\operator{P}(X\in D|T_i=x) не убывает по x\:\forall i\in M_0,

где M_0 - множество индексов верных гипотез, D - произвольное возрастающее множество, то есть, такое, что из x\in D и y \geq x следует y\in D

Впрочем, это условие весьма сложно проверить.


Литература

Handbook of Statistics: Bioinformatics in Human Health and Heredity

The Control of the False Discovery Rate in Multiple Testing under Dependency By Yoav Benjamini and Daniel Yekutieli[1]

Ссылки

Статья в английской Википедии о FDR [1]

Личные инструменты