Supongamos que tengo un experimento con dos o más factores. Un total de ANOVA se construye, y luego seguimos con dos o más conjuntos de post hoc de pruebas, dicen que las comparaciones múltiples. Mi pregunta es acerca de cómo los grandes---y cuántos---las familias deben ser utilizados como base para la multiplicidad de los ajustes de estos post hoc de ensayos.
Un ejemplo es el de la urdimbre se rompe conjunto de datos a partir de Tukey libro en la EDA. Hay dos factores: wool
(en dos niveles) y tension
(en tres niveles). La tabla ANOVA es:
Source Df Sum Sq Mean Sq F value Pr(>F)
wool 1 450.7 450.67 3.7653 0.0582130
tension 2 2034.3 1017.13 8.4980 0.0006926
wool:tension 2 1002.8 501.39 4.1891 0.0210442
Residuals 48 5745.1 119.69
Claramente, la interacción es necesario en el modelo. Así que nos decidimos a hacer comparaciones de los niveles de cada factor, sostiene el otro factor fijo. Los resultados están por debajo, con algunas anotaciones a que se hace referencia más adelante:
*** Pairwise comparisons of tension for each wool ***
*** All combined: Family T ***
wool = A: *** Family T|A ***
contrast estimate SE df t.ratio
L - M 20.5555556 5.157299 48 3.986
L - H 20.0000000 5.157299 48 3.878
M - H -0.5555556 5.157299 48 -0.108
wool = B: *** Family T|B ***
contrast estimate SE df t.ratio
L - M -0.5555556 5.157299 48 -0.108
L - H 9.4444444 5.157299 48 1.831
M - H 10.0000000 5.157299 48 1.939
*** Comparison of wool for each tension ***
*** All combined: Family W ***
tension = L: *** Family W|L ***
contrast estimate SE df t.ratio
A - B 16.333333 5.157299 48 3.167
tension = M: *** Family W|M ***
contrast estimate SE df t.ratio
A - B -4.777778 5.157299 48 -0.926
tension = H: *** Family W|H ***
contrast estimate SE df t.ratio
A - B 5.777778 5.157299 48 1.120
Creo que hay diferentes prácticas por ahí, y me pregunto que son los más comunes, y lo que los argumentos de la gente haría a favor o en contra de cada enfoque. En informática ajustado $P$ de los valores, debemos hacer multiplicidad ajustes para...
- cada uno de los cinco más pequeños de las familias (T|a, T|B, ..., W|H) por separado? (Nota - el pasado 3 familias tienen sólo una prueba por lo que no habría multiplicidad de ajuste para aquellos)
- cada una de las familias más grandes (T, con 6 pruebas y W, con 3 pruebas) por separado?
- todos los $6+3=9$ pruebas considerado como una gran familia?
Estoy interesado tanto en lo que la gente suele hacer (incluso si ellos no han pensado mucho sobre ello) y por qué (si tienen). Un par de cosas que podría mencionar son:
- Existen 3 $F$ pruebas en la tabla ANOVA. No recuerdo ver a nadie considere la posibilidad de una multiplicidad de ajuste en la prueba ANOVA. Si ese es el caso, y recomendar la opción (3), están siendo incompatible?
- Si se nos había hecho un poco más pequeño experimento en el que todas las pruebas son menos potentes, es posible que la interacción no habría sido significativo, que conduce a un número mucho menor de post hoc de comparaciones de medias marginales sólo. Por otra parte, el marginal significa que bien podría haber más pequeños SEs de la celda significa hacer en el mayor experimento. Si, además, la multiplicidad de ajuste es menos conservador, que podría tener más "significativo" de los resultados con menos datos de los que nos gustaría tener más datos.
Interesado en ver lo que la gente tiene que decir...