Tengo dificultades para entender algo. Digamos que tengo datos y construyo un modelo logit sobre esos datos. Ahora, digamos que tengo un conjunto de datos similar y más reciente con esas mismas variables, y me pregunto si el modelo original predice lo mismo en los nuevos datos. ¿Son los valores expresados en el primer modelo logit también similares en los nuevos datos? Correcto, así que me preguntaba cómo se hace esto en R. ¿Es sólo una cuestión de especificar los nuevos datos cuando se trata de predecir.
No entiendo del todo el concepto ni la aplicación de esta idea. Se agradece cualquier ayuda.
df = data.frame(sell=c("0","1","0","0","1"), home=c("own","rent","rent","rent","own"),
income=c(50,20,20,50,50), gender=c("M","M","F","F","F"))
df$sell = as.factor(df$sell)
df$home = as.factor(df$home)
df$income = as.factor(df$income)
df$gender = as.factor(df$gender)
str(df)
m1 = glm(factor(sell) ~ home + income + gender,
data=df, family=binomial(link="logit"))
summary(m1)
new.df = data.frame(sell=c("1","1","1","0","0"), home=c("own","own","rent","rent","own"),
income=c(30,30,30,50,50), gender=c("M","M","F","M","F"))
m2 = glm(factor(sell) ~ home + income + gender,
data=new.df, family=binomial(link="logit"))
summary(m2)
¿Cómo puedo responder a la pregunta de si el modelo original (m1) predijo correctamente los valores de los nuevos datos (new.df)?
Gracias.