4 votos

La interpretación de un residuos vs equipada parcela y la extracción de los puntos

Estoy haciendo un multivariante de regresión lineal con R, y me encuentro con los siguientes residuos vs equipada parcela:

plot

Como se puede ver existe una línea regular de los puntos que parece seguir un patrón exacto.

Mis preguntas son:

  1. ¿Cómo debo interpretar este tipo de comportamiento, y ¿qué puedo hacer para solucionarlo?
  2. Es allí una manera de aislar/extracto de los puntos? Me gustaría echar un vistazo a ellos de forma individual en mi conjunto de datos para ver si mediante el examen de ellos noto que algunos patrones en los datos.

Información adicional: Mi modelo es:

v.lm = lm(sqrt(v.stima$Y)~., data=v.stima)

Y es un recuento de la variable (entero no negativo). Estoy usando sqrt porque sin ella la parcela tiene el típico "embudo" de la forma que se indica que no homoscedástica de error.

3voto

Ted Puntos 854

Bien hecho para mirar los gráficos de diagnóstico para su regresión. En este caso, se han puesto de manifiesto que el modelo es inadecuado, como @Glen_b dice en los comentarios. A veces usted puede conseguir lejos con la modelización de los datos de recuento con una gaussiana "ordinario" de la regresión. Pero en este caso con claridad las violaciones de la hipótesis estándar son demasiado fuertes. Hay también muchos de los valores reales a cero, donde el modelo predice valores negativos; y este es el sesgo de todo el resultado y, por tanto, dejando una gran cantidad de estructura en los residuos. Usted necesita para mover a una distribución de Poisson glm.

En la segunda parte de tu pregunta, para referencia en el futuro el identificar() la función es una buena manera de identificar un par de puntos en un complot por ejemplo

plot(predict(v.lm), residuals(v.lm))
identify(predict(v.lm), residuals(v.lm))

Otro buen truco, cuando usted sospecha que algo acerca de esos puntos, es crear una variable ficticia para su candidato explicaciones (por ejemplo, 1 cuando la respuesta=0, 0 en caso contrario) y se asignan a un color de la estética. ggplot2 es un gran paquete para el uso de este tipo de cosas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X