Al $Y = AX + \varepsilon$ (es decir, $Y$ proviene del modelo de regresión lineal), $$\varepsilon \sim \mathcal{N}(0, \sigma^2 I) \hspace{1em} \Rightarrow \hspace{1em} \hat{e} = (I - H) Y \sim \mathcal{N}(0, (I - H) \sigma^2_{})$$ y en ese caso los residuos de $\hat{e}_1, \ldots, \hat{e}_n$ están correlacionadas y no independiente. Pero cuando hacemos la regresión de diagnóstico y se desea probar la hipótesis $\varepsilon \sim \mathcal{N}(0, \sigma^2 I)$, cada libro de texto sugiere la utilización de Q–Q parcelas y pruebas estadísticas sobre residuos de $\hat{e}$ que fueron diseñados para prueba si $\hat{e} \sim \mathcal{N}(0, \sigma^2 I)$ $\sigma^2 \en \mathbb{R}$.
¿Cómo es que no importa para estas pruebas, que los residuos están correlacionadas, y no es independiente? Con frecuencia se sugiere el uso normalizado de los residuos: $$\hat{e}_i' = \frac{\hat{e}_i}{\sqrt{1 - h_{ii}}},$$ pero eso sólo hace homoscedástica, no independiente.
Reformular la pregunta: Residuos de la regresión por MCO están correlacionados. Entiendo que, en la práctica, estas correlaciones son tan pequeñas (la mayoría del tiempo? siempre?), que puede ser ignorado cuando se prueba si los residuos de vino de la distribución normal. Mi pregunta es, ¿por qué?