Me pregunto por qué se dice que las correcciones de las pruebas múltiples son ''arbitrarias'' y que se basan en una filosofía incoherente que
la veracidad de una afirmación depende de las demás hipótesis que se sostengan
ver, por ejemplo, las respuestas y comentarios a ¿Qué pasa con los ajustes de Bonferroni? y en particular la discusión entre @FrankHarrell y @Bonferroni.
Supongamos (para simplificar y facilitar la exposición) que tenemos dos poblaciones normales (independientes), independientes y con desviaciones estándar conocidas pero con medias desconocidas. Digamos (sólo como ejemplo) que estas desviaciones típicas son resp. $\sigma_1=2, \sigma_2=3$ .
Prueba conjunta
Supongamos que queremos probar la hipótesis $H_0: \mu_1 = 2 \& \mu_2=2$ frente a $H_1: \mu_1 \ne 2 | \mu_2 \ne 2$ con un nivel de significación de $\alpha=0.05$ (el símbolo $\&$ que significa "y" mientras que $|$ significa "o").
También tenemos un resultado aleatorio $x_1$ de la primera población y $x_2$ de la segunda población.
si $H_0$ es verdadera, entonces la primera variable aleatoria $X_1 \sim N(\mu_1=2,\sigma_1=2)$ y el segundo $X_2 \sim N(\mu_2=2,\sigma_2=3)$ como asumimos la independencia se sostiene que la variable aleatoria $X^2 = \frac{(X_1-\mu_1)^2}{\sigma_1^2} + \frac{(X_2-\mu_2)^2}{\sigma_2^2}$ es $\chi^2$ con $df=2$ . Podemos utilizar este $X^2$ como estadística de prueba y aceptaremos $H_0$ si, para los resultados observados $x_1$ y $x_2$ sostiene que $\frac{(x_1-\mu_1)^2}{\sigma_1^2} + \frac{(x_2-\mu_2)^2}{\sigma_2^2} \le \chi^2_\alpha$ . En otras palabras, la región de aceptación para esta prueba es una elipse centrada en $(\mu_1, \mu_2)$ y tenemos una masa de densidad de $1-\alpha$ "encima" de esta elipse.
Pruebas múltiples
Con las pruebas múltiples haremos dos pruebas independientes y ''ajustaremos'' el nivel de significación. Así que realizaremos dos pruebas independientes $H_0^{(1)}: \mu_1 = 2$ frente a $H_1^{(1)}: \mu_1 \ne 2$ y una segunda prueba $H_0^{(2)}: \mu_2 = 2$ frente a $H_1^{(2)}: \mu_2 \ne 2$ pero con un nivel de significación ajustado $\alpha^{adj.}$ que es tal que $1-(1-\alpha^{adj.})^2=0.05$ o $(1-\alpha^{adj.})^2=0.95$ o $1-\alpha^{adj.}=\sqrt{0.95}$ o $\alpha^{adj.}=1-\sqrt{0.95}$ que da como resultado $\alpha^{adj.}=0.02532057$ .
En este caso aceptaremos $H_0^{(1)}$ y $H_0^{(1)}$ (y ambos juntos son equivalentes a nuestro ''original'' $H_0: \mu_1 = 2 \& \mu_2=2$ ) siempre que $\frac{x_1 - \mu_1}{\sigma_1} \le z_{\alpha^{adj.}} $ y $\frac{x_2 - \mu_2}{\sigma_2} \le z_{\alpha^{adj.}} $
Así que concluimos que, con pruebas múltiples, la región de aceptación para $x_1,x_2$ se ha convertido en un rectángulo con centro $(\mu_1,\mu_2)$ y con una masa de probabilidad de $1-\alpha$ encima.
Conclusión
Así, encontramos que, para una unión ( $\chi^2$ ) la forma geométrica de la región de aceptación es una elipse, mientras que con la prueba múltiple es un rectángulo. La masa de densidad ''encima'' de la región de aceptación es en ambos casos de 0,95.
Preguntas
¿Cuál es entonces el problema de las pruebas múltiples? Si existe tal problema, entonces (ver supra) debería existir el mismo problema para las pruebas conjuntas o no? La razón no puede ser que prefiramos las elipses a los rectángulos, ¿verdad?