Me refiero a cualquier razón aparte de la comodidad de poder completar el análisis en un solo procedimiento.
Respuestas
¿Demasiados anuncios?Sí, por varias razones.
1) Paradoja de los Simpsons . A menos que el diseño esté equilibrado, si una de las variables afecta al resultado, no se puede evaluar adecuadamente ni siquiera el dirección del efecto de la otra sin ajustar la primera (véase el primer diagrama del enlace, en particular - reproducido a continuación**). Esto ilustra el problema: el efecto dentro del grupo es creciente (las dos líneas de color), pero si se ignora la agrupación rojo-azul se obtiene un efecto decreciente (la línea gris discontinua), ¡un signo completamente equivocado!
Aunque esto muestra una situación con una variable continua y otra de agrupación, pueden ocurrir cosas similares cuando el ANOVA de efectos principales de dos vías no equilibrado se trata como dos modelos de una vía.
2) Supongamos que hay un diseño completamente equilibrado. Entonces todavía quiere hacerlo, porque si se ignora la segunda variable mientras se mira la primera (asumiendo que ambas tienen algún impacto) entonces el efecto de la segunda pasa a la término de ruido inflándolo... y sesgando así todos sus errores estándar hacia arriba. En cuyo caso, los efectos significativos -e importantes- podrían parecer ruido.
Considere los siguientes datos, una respuesta continua y dos factores categóricos nominales:
y x1 x2
1 2.33 A 1
2 1.90 B 1
3 4.77 C 1
4 3.48 A 2
5 1.34 B 2
6 4.16 C 2
7 5.88 A 3
8 2.56 B 3
9 5.97 C 3
10 5.10 A 4
11 2.62 B 4
12 6.21 C 4
13 6.54 A 5
14 6.01 B 5
15 9.62 C 5
El anova de efectos principales de dos vías es altamente significativo (porque está equilibrado, el orden no importa):
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x1 2 26.644 13.3220 24.284 0.0004000
x2 4 38.889 9.7222 17.722 0.0004859
Residuals 8 4.389 0.5486
Pero las anóvas unidireccionales individuales no son significativas al nivel del 5%:
(1) Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x1 2 26.687 13.3436 3.6967 0.05613
Residuals 12 43.315 3.6096
(2) Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x2 4 38.889 9.7222 3.1329 0.06511
Residuals 10 31.033 3.1033
Fíjese en que, en cada caso, el cuadrado medio del factor no cambió... pero los cuadrados medios residuales aumentaron drásticamente (de 0,55 a más de 3 en cada caso). Ese es el efecto de dejar fuera una variable importante.
** (el diagrama anterior fue hecho por el usuario de Wikipedia Schutz Aunque la atribución no es necesaria para los artículos de dominio público, creo que es digno de reconocimiento)
1 votos
Esta es la cuestión: si hay una interacción no tiene sentido "no interesarse por ella", porque no se pueden interpretar de forma significativa los efectos principales por sí solos si hay una interacción. Así que, además de la respuesta de abajo, le insto a que reconsidere lo que está haciendo.