La persona que produjo la parcela que cometió un error.
He aquí por qué. El ajuste de regresión de mínimos cuadrados ordinarios (incluyendo un término de intersección), que es donde las respuestas de $y_i$ se calcula como combinación lineal de los regresores las variables de $x_{ij}$ en forma
$$\hat y_i = \hat\beta_0 + \hat \beta_1 x_{i1} + \hat\beta_2 x_{i2} + \cdots + \hat\beta_p x_{ip}.$$
By definition, the residuals are the differences
$$e_i = y_i - \hat y_i.$$
The plot of $(\sombrero y_i, e_i)$ in the question shows a strong, consistent linear relationship. In other words, there are numbers $\hat\alpha_0$ and $\hat\alpha_1$--which we can find by fitting a line to the points in that plot--for which the values
$$f_i = e_i - (\hat\alpha_0 + \hat\alpha_1 \hat y_i)$$
are much closer to $0$ than the $e_i$ (in the sense of having much smaller sums of squares). But this says nothing other than that the revised estimates
$$\eqalign{
\hat {y}_i^\prime &= \hat {y}_i + \hat\alpha_0 + \hat\alpha_1 \hat y_i \\
y= (\hat\beta_0 + \hat\alpha_0) + (\hat\alpha_1\hat\beta_1) x_{i1} + \cdots + (\hat\alpha_1\hat\beta_p) x_{ip}\etiqueta{1}
}$$
are better, in the least squares sense, than the original estimates, because their residuals are
$$y_i - \hat{y}_i^\prime = e_i - (\hat\alpha_0 + \hat\alpha_1 \hat y_i) = f_i.$$ But this is not possible, because in $(1)$, $\sombrero y_i^\prime$ ha sido escrito de forma explícita como una combinación lineal de las originales de regresores. Que significa esta nueva solución debe tener una menor suma de cuadrados de los residuos--lo que implica el ajuste original era no una solución válida.
Este resultado vale la pena llamar a un teorema:
Teorema: El de los mínimos cuadrados pendiente de la residual-vs-predijo parcela en una de mínimos Cuadrados Ordinarios del modelo es siempre cero.
Gráficos de residuos igual que en la pregunta sólo puede surgir cuando un modelo diferente se utiliza. Las dos situaciones más comunes son: (1) cuando el modelo no incluye el de interceptar y (2) el modelo no es lineal. El mecanismo en (1) se hace evidente cuando se mira un ejemplo:
Debido a que el modelo no incluye una intercepción, la equipada con línea debe pasar a través de $(0,0)$. Dado que los datos siguen una fuerte tendencia lineal que hace que no pasan a través de $(0,0)$, el modelo es pobre, el ajuste es malo, y lo mejor que se puede hacer es pasar la equipada con línea a través del baricentro de los puntos de datos. La tendencia en el residual de la parcela es precisamente la diferencia entre la pendiente de los puntos de datos y la pendiente de la línea roja a la izquierda.
En este caso, contrario a lo que sus estados de referencia, un modelo lineal es sin duda válido. El único problema es que este ajuste no pudo incluir un término de intersección.
Usted puede intentar este ejemplo por sí mismo mediante la variación de los parámetros en la R
código que genera las figuras.
set.seed(17)
x <- seq(15, 6, length.out=50) # Specify the x-values
y <- -20 + 4 * x + rnorm(length(x), sd=2) # Generate y-values with error
fit <- lm(y ~ x - 1) # Fit a no-intercept model
par(mfrow=c(1,2)) # Prepare for two plots
plot(x,y, xlim=c(0, max(x)), ylim=c(0, max(y)), pch=16, main="Data and Fit")
abline(fit, col="Red", lwd=2, ltw=3)
plot(fit, which=1, pch=16, add.smooth=FALSE) # Residual-vs-predicted plot