2 votos

Interacción GAM: cómo interpretarla

enter image description here Estoy trabajando con un modelo GAM (basado en una distribución binomial negativa): modelo_n = gam(y ~ x1 +x2+ x3+x4 + s(x5)+x6+s(acc, by=ses)+x7+x8+ x9+x10, data=total de finales, family=negbin(3))

Me interesa la interacción entre s(acc) y la variable continua paramétrica ses. He obtenido este gráfico pero no estoy seguro de cómo interpretar la relación.

Supongo que no estoy seguro de cómo interpretar el efecto de la interacción entre s(acc) y ses en la VD - me confunde el centrado basado en cero, así que no estoy seguro de lo que significa que los valores a lo largo del eje y sean mayores o menores que 0, especialmente en el contexto de un modelo binomial negativo.

Además, ¿alguien podría recomendarme algún libro para aprender sobre las interacciones con splines en modelos GAM?

1voto

David J. Sokol Puntos 1730

En un modelo lineal, por ejemplo

$$\hat{y}_i = \beta_0 + \beta_1 x_{1i}$$

el efecto de $\mathbf{x}_1$ en la respuesta es constante. Si añadimos $\mathbf{x}_2$ al modelo y una interacción entre ambas covariables

$$\hat{y}_i = \beta_0 + \beta_1 x_{1i} + \beta_2 x_{2i} + \beta_3 (x_{1i}\times x_{2i})$$

la magnitud del efecto lineal de $\mathbf{x}_1$ depende linealmente del efecto de $\mathbf{x}_2$ .

La misma intuición guía la interpretación de un modelo de coeficientes variables como el que usted ajustó. La diferencia clave es que ahora estamos pensando en cómo la magnitud del efecto lineal de $\mathbf{x}_1$ depende sin problemas en $\mathbf{x}_2$ .

La forma de leer la trama que muestra es pensar en términos de $\hat{\beta} \times \text{ses}$ y el valor de $\hat{\beta}$ para cualquier valor de $\text{acc}$ se indica con la línea suave. El efecto de $\text{ses}$ sobre la respuesta se estima que es positiva, pero sólo para valores de $\text{acc}$ entre ~6 y ~11, con el efecto más fuerte de $\text{ses}$ sobre la respuesta encontrada en $\text{acc} \approx$ 8.

Como se trata de un modelo binomial negativo, todos los efectos anteriores están en la escala logarítmica. Habría que exponer los valores en el eje Y para ver el (ahora multiplicativo ) efecto de $\text{ses}$ en la respuesta. Sin embargo, para orientar esto, $\exp(0) = 1$ Así que la línea cero en el gráfico indica que no hay efecto o cambio en la respuesta en la escala logarítmica y en la escala de respuesta también significa que no hay efecto porque la interpretación allí es que multiplicar valores por $\exp(0) = 1$ .

Si quieres profundizar en esto visualmente, haz lo que sugiere @AndrewM, y crea un nuevo marco de datos con todas las covariables excepto acc se mantienen en sus valores medios o medianos y varían acc sobre su alcance. Si se predice desde el modelo pasando este nuevo conjunto de datos como newdata puede explorar los valores previstos en la escala de respuesta (utilizando type = "response" ) al variar acc . Yo haría esto para algunos valores de sec para que puedas ver cómo interactúan las dos variables.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X