6 votos

Lo que se puede inferir a partir de este residuo de la trama?

Esto es con referencia a http://analyticspro.org/2016/03/05/r-tutorial-residual-analysis-for-regression/.

Figure

Residual en el gráfico (b), donde los residuos están aumentando linealmente (con respecto a los valores pronosticados), podemos interpretar que nos estamos perdiendo de una variable? ¿Qué otra cosa es la interpretación?

10voto

jldugger Puntos 7490

La persona que produjo la parcela que cometió un error.

He aquí por qué. El ajuste de regresión de mínimos cuadrados ordinarios (incluyendo un término de intersección), que es donde las respuestas de $y_i$ se calcula como combinación lineal de los regresores las variables de $x_{ij}$ en forma

$$\hat y_i = \hat\beta_0 + \hat \beta_1 x_{i1} + \hat\beta_2 x_{i2} + \cdots + \hat\beta_p x_{ip}.$$

By definition, the residuals are the differences

$$e_i = y_i - \hat y_i.$$

The plot of $(\sombrero y_i, e_i)$ in the question shows a strong, consistent linear relationship. In other words, there are numbers $\hat\alpha_0$ and $\hat\alpha_1$--which we can find by fitting a line to the points in that plot--for which the values

$$f_i = e_i - (\hat\alpha_0 + \hat\alpha_1 \hat y_i)$$

are much closer to $0$ than the $e_i$ (in the sense of having much smaller sums of squares). But this says nothing other than that the revised estimates

$$\eqalign{ \hat {y}_i^\prime &= \hat {y}_i + \hat\alpha_0 + \hat\alpha_1 \hat y_i \\ y= (\hat\beta_0 + \hat\alpha_0) + (\hat\alpha_1\hat\beta_1) x_{i1} + \cdots + (\hat\alpha_1\hat\beta_p) x_{ip}\etiqueta{1} }$$

are better, in the least squares sense, than the original estimates, because their residuals are

$$y_i - \hat{y}_i^\prime = e_i - (\hat\alpha_0 + \hat\alpha_1 \hat y_i) = f_i.$$ But this is not possible, because in $(1)$, $\sombrero y_i^\prime$ ha sido escrito de forma explícita como una combinación lineal de las originales de regresores. Que significa esta nueva solución debe tener una menor suma de cuadrados de los residuos--lo que implica el ajuste original era no una solución válida.

Este resultado vale la pena llamar a un teorema:

Teorema: El de los mínimos cuadrados pendiente de la residual-vs-predijo parcela en una de mínimos Cuadrados Ordinarios del modelo es siempre cero.


Gráficos de residuos igual que en la pregunta sólo puede surgir cuando un modelo diferente se utiliza. Las dos situaciones más comunes son: (1) cuando el modelo no incluye el de interceptar y (2) el modelo no es lineal. El mecanismo en (1) se hace evidente cuando se mira un ejemplo:

Figure

Debido a que el modelo no incluye una intercepción, la equipada con línea debe pasar a través de $(0,0)$. Dado que los datos siguen una fuerte tendencia lineal que hace que no pasan a través de $(0,0)$, el modelo es pobre, el ajuste es malo, y lo mejor que se puede hacer es pasar la equipada con línea a través del baricentro de los puntos de datos. La tendencia en el residual de la parcela es precisamente la diferencia entre la pendiente de los puntos de datos y la pendiente de la línea roja a la izquierda.

En este caso, contrario a lo que sus estados de referencia, un modelo lineal es sin duda válido. El único problema es que este ajuste no pudo incluir un término de intersección.

Usted puede intentar este ejemplo por sí mismo mediante la variación de los parámetros en la R código que genera las figuras.

set.seed(17)
x <- seq(15, 6, length.out=50)            # Specify the x-values
y <- -20 + 4 * x + rnorm(length(x), sd=2) # Generate y-values with error
fit <- lm(y ~ x - 1)                      # Fit a no-intercept model

par(mfrow=c(1,2))                         # Prepare for two plots
plot(x,y, xlim=c(0, max(x)), ylim=c(0, max(y)), pch=16, main="Data and Fit")
abline(fit, col="Red", lwd=2, ltw=3)
plot(fit, which=1, pch=16, add.smooth=FALSE) # Residual-vs-predicted plot

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X