2 votos

Residuo estudiado y su varianza

Recientemente estoy leyendo el diagnóstico de regresión y me he encontrado con el residuo estudiado. Todo fue sin problemas en la comprensión, pero estoy atascado en una fórmula para calcular la varianza de la muestra después de la observación jth se elimina.

Por tanto, el residuo estudiado se define como $$r_j = \frac{\hat{e_j}}{s_{(j)} \sqrt{1-h_j}}$$

No hay ningún problema para entender lo anterior. La pregunta viene de la fórmula $${s_{(j)}}^2 = \frac{s^2(n-p)-\hat{e_j}^2/(1-h_j) }{n-p-1}$$

No entiendo cómo se ha llegado a esta conclusión. Intenté descomponerlo calculando la varianza de la muestra después de eliminar la j-ésima observación, y también intenté verlo a través de la diferencia entre la suma residual al cuadrado del modelo completo y el modelo reducido. Sin embargo, nada de lo anterior me aportó esta fórmula.

Así que si alguien pudiera ayudar o dar alguna pista, se lo agradecería mucho.

2voto

Mouffette Puntos 205
  • Tenga en cuenta que $s^2$ se define como $SSE/(n-p)$ .
  • Tenga en cuenta que $s_{(j)}^2$ se define como $SSE_{(j)}/(n-p-1)$ donde $SSE_{(j)}$ denota la suma de los residuos al cuadrado cuando se realiza la regresión después de eliminar el $j$ ª observación.

Por lo tanto, usted está pidiendo para demostrar $SSE_{(j)} = SSE - \hat{e}_j^2/(1-h_j)$ . Esto se demuestra en la Proposición 13.5.5 de "Respuestas planas a preguntas complejas" de Christensen [ PDF ]. Se apoya en un par de resultados intermedios que le preceden en la misma sección, incluyendo un caso especial de la Matriz de identidad de Woodbury (Proposición 13.5.1 del libro).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X