Considere la siguiente figura de Faraway's Linear Models with R (2005, p. 59).
El primer gráfico parece indicar que los residuos y los valores ajustados no están correlacionados, como debería ser en un modelo lineal homocedástico con errores distribuidos normalmente. Por lo tanto, los gráficos segundo y tercero, que parecen indicar una dependencia entre los residuos y los valores ajustados, sugieren un modelo diferente.
Pero, ¿por qué el segundo gráfico sugiere, como señala Faraway, un modelo lineal heteroscedástico, mientras que el tercero sugiere un modelo no lineal?
El segundo gráfico parece indicar que el valor absoluto de los residuos está fuertemente correlacionado con los valores ajustados, mientras que en el tercer gráfico no se aprecia esa tendencia. Por lo tanto, si se diera el caso de que, teóricamente, en un modelo lineal heteroscedástico con errores distribuidos normalmente
$$ \mbox{Cor}\left(\mathbf{e},\hat{\mathbf{y}}\right) = \left[\begin{array}{ccc}1 & \cdots & 1 \\ \vdots & \ddots & \vdots \\ 1 & \cdots & 1\end{array}\right] $$
(donde la expresión de la izquierda es la matriz de varianza-covarianza entre los residuos y los valores ajustados) esto explicaría por qué los gráficos segundo y tercero coinciden con las interpretaciones de Faraway.
Pero, ¿es este el caso? Si no es así, ¿cómo se pueden justificar las interpretaciones de Faraway sobre la segunda y la tercera trama? Además, ¿por qué el tercer gráfico indica necesariamente que no es lineal? ¿No es posible que sea lineal, pero que los errores no se distribuyan normalmente, o bien que se distribuyan normalmente, pero que no se centren en el cero?