2 votos

¿Está bien colocar los residuos en un contenedor antes de examinarlos?

Estoy analizando los residuos de un modelo de regresión ajustado a un conjunto de datos que abarca varios años. Quiero informar de la suma de los residuos de ese modelo, por año, como una medida de cómo el error global de cada año cambia con el tiempo.

¿Es ésta una forma aceptable de informar sobre los residuos?

He aquí un ejemplo de mi cálculo:

library(plyr)
set.seed(1)
Year <- c(  rep(2007,12),
            rep(2008,12),
            rep(2009,12),
            rep(2010,12),
            rep(2011,12))
n <- length(Year)
index <- 1:n
A <- (index+5*rnorm(n))^2+5*rnorm(n)
P <- predict(lm(A~Year),data.frame(A,Year))

residual <- A-P
residual2 <- ddply(data.frame(Year,residual),'Year',sum)

plot(2007+(index-7)/12,residual)
lines(residual2$Year,residual2$residual,col=2)

par(mfrow=c(2,1))
plot(index,residual)
plot(residual2)

1voto

DoubleDunk Puntos 128

"Aceptable" es una cuestión subjetiva, y usted tiene derecho a presentar su resultado de la forma que desee. Sin embargo, tenga en cuenta que un supuesto estándar del análisis de regresión es que los datos son independientes y se distribuyen de forma idéntica, y para medir la calidad de su modelo de regresión, se suele mirar el residuo. Los buenos residuos no cambian con el tiempo (estacionarios), y sabrá que su modelo no es adecuado si su residuo no es estacionario (es decir, cambia con el tiempo).

Así que, en resumen, puedes resumir/presentar el residuo como quieras, sin embargo, si demuestras que el residuo cambia con el tiempo, entonces habrás demostrado que el modelo no es bueno (es decir, no puedes utilizar las inferencias estándar con respecto a la estimación del coeficiente de tu modelo)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X