¿Es lo que en la varianza de la normalización es conocida mientras que en studentization no es conocido y por lo tanto, estimado? Gracias.
Respuestas
¿Demasiados anuncios?Un breve resumen. Dado un modelo de y=Xβ+ε donde X es n×p, ˆβ=(X′X)−1X′y y ˆy=Xˆβ=X(X′X)−1X′y=Hy donde H=X(X′X)−1X′ es el "sombrero de la matriz". Los residuos son e=y−ˆy=y−Hy=(I−H)y La varianza de la población σ2 es desconocido y puede ser estimado por MSE, el error cuadrático medio.
Semistudentized los residuos se definen como e∗i=ei√MSE pero, puesto que la varianza de los residuos depende tanto de σ2X, las estimaciones de la varianza es: ˆV(ei)=MSE(1−hii) donde hii iésimo elemento de la diagonal de la matriz hat.
Estandarizada de los residuos, también llamado internamente studentized residuos, son: ri=ei√MSE(1−hii)
Sin embargo, la sola ei MSE no son independientes, por lo ri no puede tener un t distribución. El procedimiento es, a continuación, eliminar el ith la observación, el ajuste de la función de regresión para el resto de n−1 observaciones, y obtener nuevos ˆy's, que puede denotarse por ˆyi(i). La diferencia: di=yi−ˆyi(i) se llama eliminado residual. Una expresión equivalente que no requiere de un cálculo es: di=ei1−hii Denotando el nuevo XMSEX(i)MSE(i), ya que no dependen de la ith observación, obtenemos: ti=di√MSE(i)1−hii=ei√MSE(i)(1−hii)∼tn−p−1 El ti's son llamados studentized (borrado) de los residuos, o externamente studentized residuos.
Ver Kutner et al., Aplica Lineal De Los Modelos Estadísticos, En El Capítulo 10.
Edit: debo decir que la respuesta por rpierce es perfecto. Pensé que el OP se acerca estandarizado y studentized residuos (y dividiendo por la desviación estándar de población para obtener estandarizada de residuos parecía extraño para mí, por supuesto), pero me equivoqué. Espero que mi respuesta puede ayudar a alguien, incluso si OT.
En ciencias sociales es típicamente se dice que Studentizated las puntuaciones de los usos del Alumno/Gosset del cálculo para la estimación de la varianza de la población/desviación estándar de la varianza de la muestra/desviación estándar (s). En contraste, los puntajes Estandarizados (un sustantivo, un tipo particular de estadística, la puntuación Z) se dice que el uso de la desviación estándar de población ?(σ).
Sin embargo, parece que hay algunas diferencias terminológicas a través de los campos (por favor vea los comentarios de esta respuesta). Por lo tanto, uno debería proceder con cautela en la toma de estas distinciones. Por otra parte, studentized puntuaciones son rara vez la llamó y uno normalmente ve 'studentized' valores en el contexto de la regresión. @Sergio proporciona detalles acerca de los tipos de studentized elimina los residuos en su respuesta.