Estoy analizando los residuos de un modelo de regresión ajustado a un conjunto de datos que abarca varios años. Quiero informar de la suma de los residuos de ese modelo, por año, como una medida de cómo el error global de cada año cambia con el tiempo.
¿Es ésta una forma aceptable de informar sobre los residuos?
He aquí un ejemplo de mi cálculo:
library(plyr)
set.seed(1)
Year <- c( rep(2007,12),
rep(2008,12),
rep(2009,12),
rep(2010,12),
rep(2011,12))
n <- length(Year)
index <- 1:n
A <- (index+5*rnorm(n))^2+5*rnorm(n)
P <- predict(lm(A~Year),data.frame(A,Year))
residual <- A-P
residual2 <- ddply(data.frame(Year,residual),'Year',sum)
plot(2007+(index-7)/12,residual)
lines(residual2$Year,residual2$residual,col=2)
par(mfrow=c(2,1))
plot(index,residual)
plot(residual2)