Estoy ajustando un modelo logístico a los datos utilizando la función glm en R. He intentado especificar términos de interacción de dos maneras:
fit1 <- glm(y ~ x*z, family = "binomial", data = myData)
fit2 <- glm(y ~ x/z, family = "binomial", data = myData)
Tengo 3 preguntas:
- ¿Cuál es la diferencia entre especificar mis términos de interacción como
x*z
en comparación conx/d
?
Cuando llamo summary(fit1)
el informe incluye resultados para el intercepto, x, z, y x:z mientras que summary(fit2)
sólo incluye resultados para intercepto, x y x:z.
Miré la sección 11.1 en "An Introduction to R" pero no pude entender el significado.
- ¿Cómo interpreto matemáticamente la ecuación de ajuste? Concretamente, ¿cómo interpreto los términos de interacción desde el punto de vista de la fórmula?
Pasando a matemáticas en lugar de R, ¿interpreto la ecuación como:
logit(y) = (intercept) + (coeff_x)*x + (coeff_z)*x + (coeff_xz)*x*z
?
Esta interpretación puede diferir en las dos especificaciones fit1
y fit2
. ¿Cuál es la interpretación de cada uno?
- Suponiendo que la interpretación anterior sea correcta, ¿cómo puedo ajustar el modelo de x*(1/z) en R? ¿Tengo que crear otra columna con estos valores?
0 votos
Esto puede quedar más claro si se da una muestra de
myData
. ¿Te refieres a tenerx/d
enfit2
? ox/z
0 votos
@mnel quise decir x/z. Acabo de corregirlo.