Para propósitos de prueba hice algunos datos correlacionados en R como este:
mydata = data.frame(
outcome = c(1, 0, 1, 0, 0, 1, 1, 0, 1, 1),
predictor = c(0.1, -0.2, 0, 0.1, -0.3, 0.3, 0.2, -0.1, 0.1, 0.1)
)
Luego hice esto para crear un modelo logístico que modelara estos datos:
model1 = glm(family = binomial, formula = outcome ~ predictor, data = mydata)
Corriendo plot(model1)
produce las siguientes parcelas:
Necesito respuestas a algunas preguntas para entender cómo realizar diagnósticos en tal modelo logístico. Como alguien que sólo tiene un curso de introducción a la estadística, tengo problemas para reunir conocimientos sobre cómo interpretar los gráficos.
- ¿Qué representan los "Valores Predichos" de la primera trama?
- ¿Qué significa residual en el contexto de la regresión logística?
- ¿Cuál de estos gráficos puede ser útil de alguna manera para el diagnóstico del modelo basado en datos reales? ¿Cómo?