5 votos

Explicación de la gráfica de diagnóstico R para regresión logística

Espero que alguien pueda explicarme este fragmento de código R relacionado con glm() . No entiendo la trama de diagnóstico que se ha sugerido. Parece que una trama más informativa sería trazar contra los valores ajustados, pero tal vez no entiendo algo. Aquí está el código:

 result <- glm(survive~age, data=donner, family=binomial)
# Why is this plotted against the respondent index?
plot(residuals(result,type="pearson"), main="pearson residual plot")
 

Datos para reproducir el ejemplo anterior:

 > dput(donner)
structure(list(age = c(23L, 40L, 40L, 30L, 28L, 40L, 45L, 62L, 
65L, 45L, 25L, 28L, 28L, 23L, 22L, 23L, 28L, 15L, 47L, 57L, 20L, 
18L, 25L, 60L, 25L, 20L, 32L, 32L, 24L, 30L, 15L, 50L, 21L, 25L, 
46L, 32L, 30L, 25L, 25L, 25L, 30L, 35L, 23L, 24L, 25L), sex = c(1L, 
0L, 1L, 1L, 1L, 1L, 0L, 1L, 1L, 0L, 0L, 1L, 1L, 1L, 0L, 0L, 1L, 
0L, 0L, 1L, 0L, 1L, 1L, 1L, 1L, 1L, 1L, 0L, 0L, 1L, 1L, 0L, 0L, 
1L, 1L, 0L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 0L), survive = c(0L, 
1L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 1L, 1L, 1L, 
1L, 0L, 0L, 1L, 1L, 0L, 0L, 1L, 1L, 1L, 1L, 1L, 1L, 0L, 0L, 1L, 
0L, 1L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 1L)), .Names = c("age", 
"sex", "survive"), class = "data.frame", row.names = c(NA, -45L
))
 

8voto

bheklilr Puntos 113

Con este diagnóstico de la trama, sólo nos fijamos en la gráfica de residuos para ver si algo salta a nosotros - un grupo de valores atípicos, o, como sucede con este tipo de datos, una clara separación de los residuos en grupos. Es simplemente uno de los varios gráficos de diagnóstico puede, y debe, hacer. Podríamos sospechar que los dos grupos se corresponden con el sexo, luego graficar los residuales vs sexo:

plot(residuals(result,type="pearson") ~ donner$sex,
     main="pearson residual vs sex plot")

que nos diría todo lo que quería saber; trazado de los residuos versus las variables explicativas (bueno, en este caso de izquierda a cabo variable) nos puede informar acerca de las posibles no linealidades y otros problemas con el modelo.

Sospecho que recibieron esto como parte de un ejercicio en el uso de gráficos de diagnóstico como herramientas para ayudar a indicar posibles mejoras del modelo, en lugar de como una especie de condición sine qua non de gráficos de diagnóstico - aunque es sin duda útil de la parcela en su propio derecho.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X