28 votos

Elección entre Tipo I, Tipo II o Tipo III ANOVA

Tenemos un conjunto de datos con tres variables (dV: medida autoinformada en la escala 1-5, que se supone que es métrica; iV1: factor con 4 niveles; iV2: factor con 8 niveles). Nos interesa saber si el dV difiere con respecto a ambos iV y si existe una interacción entre los iV.

Idea: Calcular un ANOVA con los dos efectos principales y la interacción entre ambos iVs usando R.

La pregunta: ¿Qué tipo de suma de cuadrados se debe utilizar para esta pregunta de investigación?

Usando aov() en R calcula la Suma de Cuadrados de Tipo I como estándar. SPSS y SAS, por otro lado, calculan la Suma de Cuadrados de Tipo III por defecto. Sin embargo, usando Anova() {car} en combinación con options(contrasts=c("contr.sum", "contr.poly")) en R da las mismas tablas de ANOVA de Tipo III que se calcularon en SPSS.

Ya he leído las siguientes discusiones:

Sin embargo, todavía estoy confundido sobre qué tipo de sumas de cuadrados es el más adecuado para nuestra pregunta. Los resultados (valores de F y p) difieren considerablemente.

0 votos

Si lees las discusiones encontrarás que tanto las correlaciones entre los predictores como el equilibrio en los diseños influyen en cuál de los tipos de SS utilizar. Por favor, explique esos detalles en su pregunta.

0 votos

El diseño está desequilibrado y falta una celda. Respecto a la "correlación" entre los factores: chisq.test(iV1, iV2) da una p < .001. ¿Necesita más información?

0 votos

La p no es la preocupación... la r lo es... quizás la phi de kramer, o incluso la chi.

21voto

user29884 Puntos 21

Me doy cuenta de que este post es de hace un año, pero es probable que vuelva a surgir.

Hay muchos factores que influyen en esto, yo diría que el más importante es tu hipótesis. Así que no hay una respuesta clara, pero yo suelo seguir estas reglas generales:

1) El tipo II es sólo cuando no se tiene un término de interacción.

2) Tipo I vs. Tipo III para probar el término de interacción... Yo voy a Tipo I todo el tiempo la razón es esta

El SS de tipo I para dv ~ A + B + A*B depende del orden, así que... es secuencial SS(A) SS(B|A) SS(A*B|A B)

Esto es genial para probar su interacción... pero no es genial para probar los efectos principales ya que el efecto de B depende de A.

El tipo II evita esto SS(A|B) SS(B|A)

Lo cual se ve muy bien para probar sus efectos principales SI no hay un término de interacción.

Tipo III: SS(A| A*B B) SS(B| A*B A)

Lo cual, dadas las hipótesis más comunes... no parece muy útil, ya que la mayoría de la gente está interesada en el término de interacción, no en los efectos principales cuando hay un término de interacción.

Así que en este caso utilizaría el tipo I para probar el término de interacción. Si no es significativo, volvería a ajustar sin el término de interacción y utilizaría el tipo II para probar los efectos principales.

advertencia: anova() en R es de tipo I, para obtener el tipo II (o III) utilice el Anova() en el paquete auto.

1 votos

+1 por señalar que la hipótesis definitivamente importa. Probablemente me centré demasiado en el problema específico en mi respuesta. Para los casos sencillos que estás describiendo el Tipo I y el Tipo II son lo mismo con respecto a una interacción. La única diferencia sería que con múltiples interacciones el Tipo I sigue siendo secuencial pero el Tipo II tiene en cuenta las otras interacciones, como hace con los efectos principales.

11voto

Nunca he sido un fan de los SS de tipo III para los ANOVA, así que esta es una recomendación sesgada.

Creo que en este caso debería seleccionar el Tipo II. En el ANOVA de Tipo I el orden importa. Por lo tanto, el hecho de que incluya primero iV1 o iV2 supone una diferencia porque el primero (por ejemplo, iV1) se compara con un modelo con sólo un intercepto, mientras que el segundo se compara con un modelo con un intercepto y el primero. Pruebe a cambiar el orden en el que están y verá la diferencia en los resultados del efecto principal porque sus predictores están correlacionados.

El Tipo III evita esto evaluando cada predictor, incluyendo la interacción contra un modelo que incluya todo menos ese predictor. Eso parece una buena idea hasta que se intenta considerar qué es una interacción sin uno de los efectos principales incluidos. Estás comparando el predictor con lo que es esencialmente un modelo sin sentido (creo que una de tus referencias habla de esto). (Además, recuerdo que el tipo III es especialmente sensible a las células que faltan (por lo tanto, el tipo IV, creo).

El Tipo II evita el problema del orden en el Tipo I y compara modelos sensibles (a diferencia del Tipo III). Los efectos principales se prueban con todos los demás efectos principales del modelo, pero no con la interacción. Así, cada efecto principal se interpreta fácilmente como la contribución única de ese predictor.

Tenga en cuenta que todos los tipos de SS discutidos tendrían el mismo efecto de interacción en su caso porque se evalúa con todos los efectos principales incluidos en cada caso.

1 votos

Gracias. ¿Qué pasa con el problema de que el Tipo II asume que el término de interacción es inexistente? ¿Es posible calcular un ANOVA de tipo IV en R? No he podido encontrar ninguna información al respecto.

0 votos

¿Qué hay de la argumentación de este documento? yourpsyche.org/sites/default/files/InteractionsAndTypesOfSS.pdf ? El autor argumenta que los ANOVAS de tipo I sólo prueban hipótesis relativas a la muestra y no a la población.

1 votos

Usted dijo en los comentarios de su pregunta que quería el Tipo a utilizar si no se asume ninguna interacción. Este es el Tipo. Es el mejor para los efectos principales si no hay interacción. Si hay una interacción puede tener efectos principales sesgados, pero eso no importará mucho porque la interacción será lo más importante y se pueden ignorar bastante los efectos principales (a menos que sean muy grandes, en cuyo caso no importa mucho si están un poco sesgados).

5voto

Ηλίας Puntos 109

Recientemente he tomado una decisión: no volveré a utilizar una prueba de suma de cuadrados de ANOVA, excepto para la interacción. ¿Por qué?

  • Porque, en general, la hipótesis $H_0$ de las pruebas de los efectos principales son difíciles de interpretar.

  • Porque podemos hacer algo realmente más instructivo e interpretable: comparaciones múltiples con intervalos de confianza.

2 votos

@phx ¿Es capaz de escribir el $H_0$ hipótesis para las pruebas de efectos principales? (en el caso no equilibrado). Sí, me refiero a los intervalos de confianza simultáneos. Con un diseño equilibrado, detectar una diferencia significativa para al menos una comparación debería ser equivalente a obtener un resultado significativo para la prueba ANOVA correspondiente. En el caso no equilibrado, las comparaciones múltiples son siempre fáciles de interpretar, mientras que el ANOVA es difícil, y los intervalos de confianza proporcionan mucha más información que una tabla de ANOVA. Además, a veces no le interesan todas las comparaciones por pares.

0 votos

Gracias. ¿Te refieres a calcular las comparaciones múltiples utilizando correcciones alfa? Podrían surgir problemas si tiene factores con un número grande (k>3) de niveles. ¿Por qué crees que la H0 es difícil de interpretar?

0 votos

Tengo que pensar en lo concreto $H_0$ . Las comparaciones múltiples podrían ser un enfoque a seguir. Sin embargo, en este momento nos preguntamos si iV1 (4 niveles) influye en y controlando iV2 (8 niveles). No estoy seguro de que las comparaciones múltiples sean apropiadas en este contexto.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X