5 votos

Resumen de los residuos en R

Here is an image for details! (https://onlinecourses.science.psu.edu/stat504/sites/onlinecourses.science.psu.edu.stat504/files/lesson07/crab_r_output_02.gif)

Haciendo caso omiso de "Desviación" en la imagen, la salida del análisis de regresión múltiple en R se parece bastante a esto. Por lo que yo entiendo, los residuos son errores. ¿El resumen de 5 valores se refiere a los residuos como errores de estimación, o son diferentes? ¿O mi comprensión de los residuos es errónea?

0 votos

En caso de que no lo sepas, puedes ver todos los residuos utilizando model$residuals .

0 votos

resid(model) es preferible a model$residuals . Algunas veces serán iguales y otras no.

5voto

Sean Hanley Puntos 2428

El Resumen de 5 números de la residuos que se ven son los valores que se utilizarían para construir un boxplot . Los residuos no son necesariamente errores de estimación, aunque se podría pensar en ellos de esa manera; depende de lo que se intente estimar/predecir.

  • El valor que la gente suele utilizar como "predicción" es $\hat y$ . En realidad, esta es la previsión media de la distribución condicional de $y$ Es decir $\mathcal N(\mu_Y|x_i, \sigma^2_\varepsilon)$ . En este caso, los residuos ayudan a entender el resto de esa distribución condicional (por ejemplo, su varianza).
  • Como alternativa, puede utilizar $\hat y$ como predicción de puntos para el valor de una nueva observación cuando $X=x_i$ . Esto es razonable porque, a priori, la media de una distribución normal es el valor puntual más probable. Sin embargo, siempre se equivocará. La distribución de sus residuos puede indicarle lo alejado que estará el valor de una nueva observación de media de $\hat y$ (es decir, su DS).
  • Los residuos también son útiles para ayudarle a estimar las propiedades de las distribuciones de muestreo de sus estadísticas muestrales (específicamente, sus betas), y para diagnosticar posibles problemas con su modelo.

No importa cómo piense / utilice sus residuos, esos valores son simplemente un resumen no paramétrico de su distribución. (Tenga en cuenta que la discusión anterior es genérica, y no tiene en cuenta el hecho de que el modelo mostrado en la pregunta es un Poisson regresión y los residuos mostrados son desviación residuales).

5voto

AdamSane Puntos 1825

Esas cifras son residuos de desviación .

$$r_{d_i} = \operatorname{sign}(y_i -\hat{\mu_i}) \sqrt{d_i}$$

donde $d_i$ es la contribución de las observaciones individuales al desviación .

NO son como los residuos de la regresión ordinaria, que serían $y_i -\hat{\mu_i}$

Conceptualmente, los residuos de Pearson se asemejan más a la noción de un residuo de regresión: una escala $y_i -\hat{\mu_i}$ .

Sin embargo, los residuos de Pearson pueden tender a estar bastante sesgados en los GLM y tener otros problemas, mientras que los residuos de desviación tienden a ser más normales.

El glm en R devuelve una función que define $d_i$ para cada modelo.

Por ejemplo, 1

utils::data(anorexia, package="MASS")
anorex.1 <- glm(Postwt ~ Prewt + Treat + offset(Prewt),
                family = gaussian, data = anorexia)

anorex.1$family$dev.resids
function (y, mu, wt) 
wt * ((y - mu)^2)      #<---- d(i) for a gaussian model 
<bytecode: 0x0bef2398>
<environment: 0x0d214114>

Por ejemplo, 2

clotting <- data.frame(
    u = c(5,10,15,20,30,40,60,80,100),
    lot1 = c(118,58,42,35,27,25,21,19,18),
    lot2 = c(69,35,26,21,18,16,13,12,12))
glm(lot1 ~ log(u), data=clotting, family=Gamma)$family$dev.resids
function (y, mu, wt) 
-2 * wt * (log(ifelse(y == 0, 1, y/mu)) - (y - mu)/mu) #<- d(i) for Gamma model
<bytecode: 0x0cd3d11c>
<environment: 0x0cd3fd94>

0 votos

¿Podría explicar el significado de la wt parámetro para dev.resids() ? Gracias.

1 votos

@a11msp Los valores en "wt" son los pesos pasados al glm a través del argumento 'weights'.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X