3 votos

¿Cómo comprobar si una interacción es significativa: términos de interacción o comparación de modelos?

Hago la pregunta basándome en un caso actual, pero agradecería mucho una respuesta general, porque me lleva dando la lata desde hace tiempo:

Estoy haciendo regresiones con efectos de interacción. ¿Cómo puedo comprobar si la interacción es significativa?

Opción A: Miro los coeficientes de interacción. Si son significativos, la interacción es significativa.

Opción B: Ejecuto dos modelos de regresión: Uno con todos los efectos principales y otro con los efectos principales y los términos de interacción. Si el poder explicativo del modelo de interacción es significativamente mayor, interpreto la interacción. (por ejemplo, comparando los dos modelos con la función anova() en R; ejecutando una prueba F)

Muchos de mis colegas eligen la opción A, pero creo recordar que mi profesor de estadística insistía en que la opción B es preferible.

Esta pregunta se ha vuelto pertinente, porque tengo algunos modelos en los que el término de interacción es significativo, pero el poder explicativo de los modelos con y sin la interacción no es significativamente diferente.

7voto

user2735206 Puntos 51

Opción B.

La opción A puede ser incoherente, especialmente si hay variables categóricas. El simple hecho de cambiar el grupo de referencia puede modificar drásticamente los valores p de cada término ficticio y de cada término de interacción ficticio en el resultado de la regresión.

La opción B proporciona una prueba global y sería la misma independientemente del grupo de referencia seleccionado.


¿Tiene alguna idea sobre el caso de predictores continuos "normales"? continuos "normales"?

Para un predictor continuo normal, el valor p de la interacción es el mismo que el valor p de la prueba F, suponiendo que ambos $x_1$ y $x_2$ son continuos, el modelo sin interacción lo es:

$$y = \beta_0 + \beta_1 x_1 + \beta_2 x_2$$

Y el modelo de interacción es:

$$y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \beta_3 (x_1 \times x_2)$$

Estas dos corresponden al modelo "reducido" y "completo" para la prueba F, y puesto que el término extra sólo es $\beta_3$ la suma de cuadrados adicional en el modelo completo sólo la aporta ella, lo que significa que su propio valor p será el mismo que el valor p de la prueba F.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X