42 votos

La interpretación residual gráficos de diagnóstico para la glm modelos?

Estoy buscando las directrices sobre cómo interpretar los gráficos de residuos de los modelos glm. Especialmente poisson, binomial negativa, binomio modelos. ¿Qué podemos esperar de estas parcelas cuando los modelos son "correctas"? (por ejemplo, esperamos que la varianza a crecer a medida que el valor de la predicción aumenta, cuando se trata de un modelo de Poisson)

Sé que las respuestas dependen de los modelos. Todas las referencias (o puntos generales a tener en cuenta) será útil/apreciado.

19voto

Jens Puntos 613

Creo que esta es una de las partes más difíciles cuando se hace el análisis de regresión. Yo también lucha con la mayoría de las interpretaciones (en particular binomio de diagnóstico son una locura!).

Me tropecé en este post http://www.r-bloggers.com/model-validation-interpreting-residual-plots/ que también vinculado http://statmaster.sdu.dk/courses/st111/module04/index.html#SECTION00020000000000000000

lo que me ayuda a la mayoría es para graficar los residuos frente a cada parámetro predictivo incluido Y no incluido en el modelo. Esto significa que también los que fueron descartados de antemano para multicolinearity razones. Para este boxplots, condicional diagramas de dispersión y normal diagramas de dispersión son grandes. esto ayuda a detectar posibles errores

En el "Bosque de Analytics con R" (Usuario de la Serie) son algunas de las buenas explicaciones de cómo interpretar los residuos de modelos de efectos mixtos (y glms). Buena lectura! http://www.springer.com/statistics/life+ciencias+medicina+%26+salud/libro/978-1-4419-7761-8

Algún día atrás pensé en un sitio web que podría recoger residual de los patrones que los usuarios pueden votar a "aceptar" y a "no aceptar". pero nunca he encontrado ese sitio web ;)

saludos

12voto

Eero Puntos 1612

Yo sugeriría que los métodos descritos en:

 Buja, A., Cook, D. Hofmann, H., Lawrence, M. Lee, E.-K., Swayne,
 D.F and Wickham, H. (2009) Statistical Inference for exploratory
 data analysis and model diagnostics Phil. Trans. R. Soc. A 2009
 367, 4361-4383 doi: 10.1098/rsta.2009.0120

Hay un par de ideas diferentes, pero que en su mayoría vienen abajo a la simulación de los datos donde usted saber cuál es la verdadera relación es, y que la relación se basa en el análisis de los datos reales. A continuación, se compara el diagnóstico a partir de los datos reales para el diagnóstico de los conjuntos de datos simulados. El vis.test función en el TeachingDemos paquete de R implementa una variación de 1 de las sugerencias en el papel. Leer el documento completo (no solo mi muy corto sumarization) para una mejor comprensión.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X