21 votos

¿Lo que ' s la diferencia entre normalización y studentization?

¿Es lo que en la varianza de la normalización es conocida mientras que en studentization no es conocido y por lo tanto, estimado? Gracias.

21voto

bessman Puntos 2514

Un breve resumen. Dado un modelo de $y=X\beta+\varepsilon$ donde $X$ es $n\times p$, $\hat\beta=(X'X)^{-1}X'y$ y $\hat y=X\hat\beta=X(X'X)^{-1}X'y=Hy$ donde $H=X(X'X)^{-1}X'$ es el "sombrero de la matriz". Los residuos son $$e=y-\hat y=y-Hy=(I-H)y$$ La varianza de la población $\sigma^2$ es desconocido y puede ser estimado por $MSE$, el error cuadrático medio.

Semistudentized los residuos se definen como $$e_i^*=\frac{e_i}{\sqrt{MSE}}$$ pero, puesto que la varianza de los residuos depende tanto de $\sigma^2$$X$, las estimaciones de la varianza es: $$\widehat V(e_i)=MSE(1-h_{ii})$$ donde $h_{ii}$ $i$ésimo elemento de la diagonal de la matriz hat.

Estandarizada de los residuos, también llamado internamente studentized residuos, son: $$r_i=\frac{e_i}{\sqrt{MSE(1-h_{ii})}}$$

Sin embargo, la sola $e_i$ $MSE$ no son independientes, por lo $r_i$ no puede tener un $t$ distribución. El procedimiento es, a continuación, eliminar el $i$th la observación, el ajuste de la función de regresión para el resto de $n-1$ observaciones, y obtener nuevos $\hat y$'s, que puede denotarse por $\hat y_{i(i)}$. La diferencia: $$d_i=y_i-\hat y_{i(i)}$$ se llama eliminado residual. Una expresión equivalente que no requiere de un cálculo es: $$d_i=\frac{e_i}{1-h_{ii}}$$ Denotando el nuevo $X$$MSE$$X_{(i)}$$MSE_{(i)}$, ya que no dependen de la $i$th observación, obtenemos: $$t_i=\frac{d_i}{\sqrt{\frac{MSE_{(i)}}{1-h_{ii}}}} =\frac{e_i}{\sqrt{MSE_{(i)}(1-h_{ii})}}\sim t_{n-p-1}$$ El $t_i$'s son llamados studentized (borrado) de los residuos, o externamente studentized residuos.

Ver Kutner et al., Aplica Lineal De Los Modelos Estadísticos, En El Capítulo 10.

Edit: debo decir que la respuesta por rpierce es perfecto. Pensé que el OP se acerca estandarizado y studentized residuos (y dividiendo por la desviación estándar de población para obtener estandarizada de residuos parecía extraño para mí, por supuesto), pero me equivoqué. Espero que mi respuesta puede ayudar a alguien, incluso si OT.

9voto

BBlake Puntos 310

En ciencias sociales es típicamente se dice que Studentizated las puntuaciones de los usos del Alumno/Gosset del cálculo para la estimación de la varianza de la población/desviación estándar de la varianza de la muestra/desviación estándar ($s$). En contraste, los puntajes Estandarizados (un sustantivo, un tipo particular de estadística, la puntuación Z) se dice que el uso de la desviación estándar de población ?($\sigma$).

Sin embargo, parece que hay algunas diferencias terminológicas a través de los campos (por favor vea los comentarios de esta respuesta). Por lo tanto, uno debería proceder con cautela en la toma de estas distinciones. Por otra parte, studentized puntuaciones son rara vez la llamó y uno normalmente ve 'studentized' valores en el contexto de la regresión. @Sergio proporciona detalles acerca de los tipos de studentized elimina los residuos en su respuesta.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X