Tenemos un conjunto de datos con tres variables (dV: medida autoinformada en la escala 1-5, que se supone que es métrica; iV1: factor con 4 niveles; iV2: factor con 8 niveles). Nos interesa saber si el dV difiere con respecto a ambos iV y si existe una interacción entre los iV.
Idea: Calcular un ANOVA con los dos efectos principales y la interacción entre ambos iVs usando R.
La pregunta: ¿Qué tipo de suma de cuadrados se debe utilizar para esta pregunta de investigación?
Usando aov()
en R calcula la Suma de Cuadrados de Tipo I como estándar. SPSS y SAS, por otro lado, calculan la Suma de Cuadrados de Tipo III por defecto. Sin embargo, usando Anova() {car}
en combinación con options(contrasts=c("contr.sum", "contr.poly"))
en R da las mismas tablas de ANOVA de Tipo III que se calcularon en SPSS.
Ya he leído las siguientes discusiones:
- http://afni.nimh.nih.gov/sscc/gangc/SS.html
- http://myowelt.blogspot.de/2008/05/obtaining-same-anova-results-in-r-as-in.html
Sin embargo, todavía estoy confundido sobre qué tipo de sumas de cuadrados es el más adecuado para nuestra pregunta. Los resultados (valores de F y p) difieren considerablemente.
0 votos
Si lees las discusiones encontrarás que tanto las correlaciones entre los predictores como el equilibrio en los diseños influyen en cuál de los tipos de SS utilizar. Por favor, explique esos detalles en su pregunta.
0 votos
El diseño está desequilibrado y falta una celda. Respecto a la "correlación" entre los factores: chisq.test(iV1, iV2) da una p < .001. ¿Necesita más información?
0 votos
La p no es la preocupación... la r lo es... quizás la phi de kramer, o incluso la chi.
0 votos
Phi de Cramer = 0,1573928, Chi^2 = 45,4823
0 votos
Vale, he leído más. Para especificar mis preguntas: Las sumas de cuadrados para los términos de interacción son las mismas para los ANOVAS de tipo I y de tipo III. Por lo tanto, no importa qué tipo de ANOVA calcular siempre que sólo mire las interacciones. Si las interacciones son significativas, no puedo interpretar los efectos principales de todos modos. Eso descompone mi pregunta inicial de la siguiente manera: ¿Qué tipo de ANOVA se debe utilizar si no se puede suponer ninguna interacción entre los factores?
1 votos
Los efectos principales son no universalmente ininterpretable si hay interacciones significativas. Para uno de los muchos ejemplos posibles, si A en Y ~ A * B es relativamente grande en comparación con todos los demás efectos, y especialmente si se sabe que B tiene un rango limitado (por ejemplo, el sexo), entonces la interacción de A está bien, incluso puede ser importante, incluso si A:B es significativa. (Y a la inversa, la mera presencia de una interacción, sea o no significativa, hace que los coeficientes de regresión para los efectos principales tengan un significado limitado).
2 votos
Extremadamente relacionado: stats.stackexchange.com/questions/20452 con una gran respuesta de @gung.