A menudo veo que los autores de estudios a gran escala que teóricamente deben realizar múltiples correcciones de prueba para una gran cantidad de pruebas hacen un prefiltrado, es decir, desechan todas las pruebas que no se ven bien a simple vista (por ejemplo, la comparación de 10000 características entre dos grupos - los investigadores pueden desechar todas las características con grandes varianzas o pequeñas varianzas antes de realizar cualquier prueba).
Por ejemplo, un buen ejemplo seguro y correcto de prefiltrado: el truco de Tarone, por ejemplo, en la séptima diapositiva aquí: https://www.ethz.ch/content/dam/ethz/special-interest/bsse/borgwardt-lab/documents/talk_slides/KBorgwardt_UniBasel_20160421.pdf .
Pero la corrección del prefiltrado a veces no es tan obvia en otros estudios. A veces literalmente parece como "filtramos los valores de p que son mayores de 0.5" o cercanos a eso, "la mayoría de los ejemplos que filtramos probablemente tienen valores de p grandes" - pero en otras palabras, pueden usar "tamaño del efecto" en lugar de "valor de p" (al aplicar la prueba t), y así sucesivamente.
La pregunta es: ¿cuándo es correcto el prefiltrado de algunas pruebas antes del procedimiento de control FDR, y cuándo es un fraude?
UPD: Encontré este documento que obviamente aborda el tema, pero solo comencé a leerlo.