34 votos

Residuos brutos frente a residuos estandarizados frente a residuos estudiados: ¿qué utilizar y cuándo?

Este parece una pregunta similar y no obtuvo muchas respuestas.

Omitiendo las pruebas como la D de Cook, y sólo observando los residuos como grupo, me interesa saber cómo otros utilizan los residuos al evaluar la bondad del ajuste. Yo utilizo los residuos brutos:

  1. en un gráfico QQ, para evaluar la normalidad
  2. en un gráfico de dispersión de $y$ frente a los residuos, para comprobar (a) la hetereoscedasticidad y (b) la autocorrelación serial.

Para el trazado $y$ frente a los residuos para examinar los valores de $y$ donde pueden aparecer valores atípicos, prefiero utilizar el Residuos estudiados . La razón de mi preferencia es que permite ver fácilmente qué residuos en qué $y$ -son problemáticos, aunque residuos normalizados proporcionan un resultado muy similar. Mi teoría sobre cuál se utiliza es que depende de la universidad a la que se haya ido.

¿Es esto similar a cómo otros utilizan los residuos? ¿Utilizan otros este número de gráficos en combinación con las estadísticas de resumen?

9voto

gmark Puntos 66

Esto no es tanto una respuesta como una aclaración de la terminología. Su pregunta se refiere a los residuos brutos, estandarizados y estudiados. Sin embargo, esta no es la terminología utilizada por la mayoría de los estadísticos, aunque observo que sus apuntes de clase indican que sí lo es.

Crudo: como lo tienes tú.

Estandarizado: se trata en realidad de los residuos brutos divididos por la verdadera desviación estándar de los residuos. Como la verdadera desviación estándar rara vez se conoce, casi nunca se utiliza un residuo estandarizado.

Estudiado internamente: Como la verdadera desviación estándar de los residuos no suele conocerse, se utiliza en su lugar la desviación estándar estimada. Se trata de un residuo interanlly studentized, y es lo que ha llamado estandarizado.

Estudiado externamente: lo mismo que el residuo estudiado internamente, salvo que la estimación de la desviación estándar de los residuos se calcula a partir de una regresión que deja fuera la observación en cuestión.

Pearson: el residuo bruto dividido por la desviación estándar de la variable de respuesta (la variable y) y no de los residuos. Este no aparece en la lista.

"dejar uno fuera": No tiene un nombre formal, pero es el mismo que las notas de clase.

estandarizado "dejar uno fuera": tampoco tiene un nombre formal, pero esto no es lo que los apuntes de clase llaman studentized.

Fuentes:

  1. el mismo enlace de la wiki que tienes sobre los residuos estudiados ("un residuo estudiado es el cociente resultante de la división de un residuo por una estimación de su desviación estándar")

  2. documentación para el cálculo de residuos en SAS

2voto

curiousguy Puntos 81

Re: parcelas,

Existe una cosa que se llama sobreajuste, pero el sobretrazado no puede hacer mucho daño, especialmente en la fase de diagnóstico. Un gráfico de probabilidad normal estandarizado no puede hacer daño al lado de su gráfico QQ. Creo que es mejor evaluar la parte media de la distribución.

Re: residuos,

En la fase de borrador, realizo tanto los residuos estandarizados como los estudiados, y normalmente acabo codificando los estandarizados. No sé lo que otras personas realmente ejecutan, porque los diagnósticos están realmente codificados en el material de replicación que encuentro en línea.

Re: diagnóstico,

Para un modelo lineal, suelo añadir factores de inflación de la varianza (con el vif en Stata) y algunas pruebas de homocedasticidad (por ejemplo, con el comando hettest en Stata), así como la descomposición del modelo con regresión anidada para comprobar si el $R^2$ tiene algún sentido.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X