48 votos

Interpretación del gráfico de residuos frente a los valores ajustados para verificar los supuestos de un modelo lineal

Considere la siguiente figura de Faraway's Linear Models with R (2005, p. 59).

enter image description here

El primer gráfico parece indicar que los residuos y los valores ajustados no están correlacionados, como debería ser en un modelo lineal homocedástico con errores distribuidos normalmente. Por lo tanto, los gráficos segundo y tercero, que parecen indicar una dependencia entre los residuos y los valores ajustados, sugieren un modelo diferente.

Pero, ¿por qué el segundo gráfico sugiere, como señala Faraway, un modelo lineal heteroscedástico, mientras que el tercero sugiere un modelo no lineal?

El segundo gráfico parece indicar que el valor absoluto de los residuos está fuertemente correlacionado con los valores ajustados, mientras que en el tercer gráfico no se aprecia esa tendencia. Por lo tanto, si se diera el caso de que, teóricamente, en un modelo lineal heteroscedástico con errores distribuidos normalmente

$$ \mbox{Cor}\left(\mathbf{e},\hat{\mathbf{y}}\right) = \left[\begin{array}{ccc}1 & \cdots & 1 \\ \vdots & \ddots & \vdots \\ 1 & \cdots & 1\end{array}\right] $$

(donde la expresión de la izquierda es la matriz de varianza-covarianza entre los residuos y los valores ajustados) esto explicaría por qué los gráficos segundo y tercero coinciden con las interpretaciones de Faraway.

Pero, ¿es este el caso? Si no es así, ¿cómo se pueden justificar las interpretaciones de Faraway sobre la segunda y la tercera trama? Además, ¿por qué el tercer gráfico indica necesariamente que no es lineal? ¿No es posible que sea lineal, pero que los errores no se distribuyan normalmente, o bien que se distribuyan normalmente, pero que no se centren en el cero?

2voto

Zizzencs Puntos 1358

Usted escribió

El segundo gráfico parece indicar que el valor absoluto de los residuales está fuertemente correlacionado con los valores ajustados,

No lo "parece", lo hace. Y eso es lo que significa heteroskedastic.

Entonces das una matriz de todos los 1s, que es irrelevante; la correlación puede existir y ser menor que 1.

Entonces escribe

Además, ¿por qué el tercer gráfico indica necesariamente la no linealidad? ¿No es posible que sea lineal, pero que los errores no estén no se distribuyan normalmente, o que se distribuyan normalmente pero no se centran alrededor de cero?

Ellos hacer se centran en torno a 0. La mitad, más o menos, están por debajo de 0, la otra mitad por encima. Es más difícil saber si se distribuyen normalmente a partir de este gráfico, pero otro gráfico que se suele recomendar es un gráfico de cuantiles normales de los residuos, y eso mostraría si son normales o no.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X