He estado tratando de envolver mi cabeza alrededor de cómo la Tasa de Falso Descubrimiento (FDR) debe informar de las conclusiones del investigador individual. Por ejemplo, si su estudio es de poca potencia, debe de descuento en sus resultados, incluso si son significativos en $\alpha = .05$? Nota: estoy hablando de la FDR en el contexto del examen de los resultados de múltiples estudios, en conjunto, no como un método para la prueba de múltiples correcciones.
Hacer el (tal vez generoso) suposición de que $\sim.5$ de hipótesis a prueba de hecho verdadero, el FDR es una función tanto del tipo I y tipo II, las tasas de error de la siguiente manera:
$$\text{FDR} = \frac{\alpha}{\alpha+1-\beta}.$$
Es lógico que si un estudio es lo suficientemente poca potencia, no debemos confiar en los resultados, incluso si son significativos, por mucho que se las de una potencia adecuada de estudio. Así que, como algunos estadísticos diría, hay circunstancias en las que, "en el largo plazo", que se pueda publicar muchos de los importantes resultados que son falsas si seguimos las pautas tradicionales. Si un cuerpo de investigación se caracteriza por consistentemente estudios limitados (por ejemplo, el gen candidato de $\times$ ambiente de interacción de la literatura de la década anterior), incluso replicado los hallazgos significativos puede ser sospechoso.
La aplicación de los paquetes de R extrafont
, ggplot2
y xkcd
, creo que esto podría ser útil conceptualiza como un problema de perspectiva:
Dada esta información, lo que se debe a un investigador (a) a hacer a continuación? Si tengo una conjetura de lo que el tamaño del efecto estoy estudiando debería ser (y por lo tanto una estimación de $1 - \beta$, dado mi tamaño de la muestra), debo ajustar mi $\alpha$ nivel hasta el FDR = .05? Debo publicar los resultados en el $\alpha = .05$ nivel, incluso si mis estudios son de poca potencia y dejar a consideración de la FDR a los consumidores de la literatura?
Sé que este es un tema que ha sido discutido con frecuencia, tanto en este sitio y en las estadísticas de la literatura, pero me parece que no puede encontrar un consenso de opinión sobre este tema.
EDIT: En respuesta a @ameba del comentario, el FDR puede ser derivado de la norma de tipo I/tipo II tasa de error de tabla de contingencia (perdón por su fealdad):
| |Finding is significant |Finding is insignificant |
|:---------------------------|:----------------------|:------------------------|
|Finding is false in reality |alpha |1 - alpha |
|Finding is true in reality |1 - beta |beta |
Así, si se nos presenta un hallazgo significativo (columna 1), la probabilidad de que es falso, que en realidad es el alfa por encima de la suma de la columna.
Pero sí, podemos modificar nuestra definición de la FDR para reflejar el (antes de) probabilidad de que una hipótesis es verdadera, a través del estudio de alimentación de $(1 - \beta)$ desempeña todavía un papel:
$$\text{FDR} = \frac{\alpha \cdot (1- \text{antes})}{\alpha \cdot (1- \text{antes}) + (1-\beta) \cdot \text{antes}}$$