Esta es la apariencia que se espera de dicho gráfico cuando la variable dependiente es discreta.
Cada trazo curvilíneo de los puntos del gráfico corresponde a un valor fijo $k$ de la variable dependiente $y$ . Todos los casos en los que $y=k$ tiene una predicción $\hat{y}$ su residuo, por definición, es igual a $k-\hat{y}$ . La trama de $k-\hat{y}$ frente a $\hat{y}$ es obviamente una línea con pendiente $-1$ . En la regresión de Poisson, el eje x se muestra en una escala logarítmica: es $\log(\hat{y})$ . Las curvas ahora se doblan exponencialmente hacia abajo. Como $k$ varía, estas curvas se elevan en cantidades integrales. Al exponerlas se obtiene un conjunto de curvas casi paralelas. (Para demostrarlo, el gráfico se construirá explícitamente a continuación, coloreando por separado los puntos según los valores de $y$ .)
Podemos reproducir la trama en cuestión bastante cerca mediante un modelo similar pero arbitrario (utilizando pequeños coeficientes aleatorios):
# Create random data for a random model.
set.seed(17)
n <- 2^12 # Number of cases
k <- 12 # Number of variables
beta = rnorm(k, sd=0.2) # Model coefficients
x <- matrix(rnorm(n*k), ncol=k) # Independent values
y <- rpois(n, lambda=exp(-0.5 + x %*% beta + 0.1*rnorm(n)))
# Wrap the data into a data frame, create a formula, and run the model.
df <- data.frame(cbind(y,x))
s.formula <- apply(matrix(1:k, nrow=1), 1, function(i) paste("V", i+1, sep=""))
s.formula <- paste("y ~", paste(s.formula, collapse="+"))
modl <- glm(as.formula(s.formula), family=poisson, data=df)
# Construct a residual vs. prediction plot.
b <- coefficients(modl)
y.hat <- x %*% b[-1] + b[1] # *Logs* of the predicted values
y.res <- y - exp(y.hat) # Residuals
colors <- 1:(max(y)+1) # One color for each possible value of y
plot(y.hat, y.res, col=colors[y+1], main="Residuals v. Fitted")
0 votos
No sé si puedes subir el gráfico (a veces los recién llegados no pueden), pero si no, ¿podrías al menos añadir algunos datos y código R a tu pregunta para que la gente pueda evaluarlo?
0 votos
Jocelyn, he actualizado tu post con la información que pusiste en un comentario. También he etiquetado esto como
homework
desde que hablaste de un encargo.0 votos
Prueba con plot(jitter(mod1)) para ver si el gráfico es un poco más legible. ¿Por qué no definir los residuos para nosotros y nos dan su mejor conjetura como la interpretación de la gráfica a ti mismo.
0 votos
Además, busque la distribución de Poisson y luego grafique su variable de resultado. plot(doctorco) - debe ser estrictamente positivo.
1 votos
A partir de la pregunta, voy a suponer que usted entiende la distribución de Poisson y el registro de Pois, y lo que un gráfico de residuos frente a los valores ajustados le dice (actualización si eso es incorrecto), por lo que sólo se pregunta sobre la apariencia impar de los puntos en el gráfico. Dado que se trata de una tarea para casa, no respondemos del todo como política general, sino que proporcionamos pistas. Me doy cuenta de que usted tiene un lote de covariables, me pregunto si tiene 1 covariable continua y muchas covariables binarias.
0 votos
Sí, me pregunto por la apariencia de los puntos. Hay una mezcla de binario y continuo. He utilizado la eliminación hacia atrás para hacer un modelo más simple. El modelo más simple también tiene variables binarias y continuas, y el gráfico tiene un aspecto similar.
1 votos
Dos seguimientos del comentario de gung. En primer lugar, prueba
table(dvisits$doctorco)
. ¿A qué corresponden las 10 líneas curvas de su gráfico, en esta tabla? Además, con más de 5000 observaciones, no te preocupes demasiado por ajustar 13 coeficientes de regresión.