False discovery rate
Матеріал із MachineLearning.
FDR(такожFalse discovery rate,Очікувана частка помилкових відхилень) — один із заходів, що узагальнюють помилку першого роду, що розглядається під час перевірки статистичних гіпотез, на багатовимірний випадок завдання множинної перевірки гіпотез. Розмір визначено як математичне очікування частки помилок серед відкинутих гіпотез.
Зміст
Визначення
Нехай - сімейство нульових гіпотез, а - відповідні їм рівні значимості, що досягаються, на статистиках проти альтернатив. Позначимо за - число відкинутих гіпотез, а по - число невірно відкинутих гіпотез, тобто. число помилок першого роду.
Очікувана частка помилкових відхилень гіпотез, або FDR визначається таким чином
0]\right)" alt= "FDR\:=\: \operator\left(\frac[R & 0;\right)" />
Контроль над FDR на рівні означає, що
0]\right) \leq \alpha" alt= "FDR\:=\: \operator\left(\frac[R> 0]\right) \leq \alpha" />
Зв'язок із FWER
Для будь-якої процедури множинної перевірки гіпотез FDR ≤ FWER.
Допустимо всі гіпотези вірні. Тоді:
0] = 0" alt= "\frac[R > 0] = 0" /> якщо з ймовірністю 0] = 1" alt= "\frac[R > 0] = 1" /> якщо , , . з ймовірністю P \ (V \ geq1 \)
Методи контролю
Забезпечує контроль за умови незалежності статистик. Або за умови ∓mdash positive regression dependence on subset [1] on :
де - безліч індексів вірних гіпотез, - довільна зростаюча множина, тобто така, що з і випливає
Втім, цю умову дуже складно перевірити.
Література
Handbook of Statistics: Bioinformatics в Human Health and Heredity
Control of False Discovery Rate in Multiple Testing under Dependency By YoavBenjamini та Daniel Yekutieli [1]