Contexto
Esta pregunta se usa R, pero se acerca general de las cuestiones estadísticas.
Estoy analizando los efectos de los factores de mortalidad (% de mortalidad debido a las enfermedades y parasitismo) sobre la polilla de la tasa de crecimiento de población a lo largo del tiempo, donde las poblaciones de larvas fueron muestreados de 12 sitios una vez al año durante 8 años. La tasa de crecimiento poblacional de los datos muestra una clara, pero de forma irregular tendencia cíclica a lo largo del tiempo.
Los residuos de un simple modelo lineal generalizado (tasa de crecimiento ~ %enfermedad + %parasitismo + año) muestran igualmente claro, pero de forma irregular tendencia cíclica a lo largo del tiempo. Por lo tanto, la generalización de los mínimos cuadrados de los modelos de la misma forma también fueron equipados con los datos con la adecuada correlación de estructuras para lidiar con la autocorrelación temporal, por ejemplo, el compuesto de la simetría, proceso autorregresivo de orden 1 y autorregresivo de media móvil de correlación de las estructuras.
Los modelos de todos los contenidos de la misma de efectos fijos, se compararon mediante la AIC, y fueron equipados por REML (para permitir la comparación de diferentes estructuras de correlación por AIC). Estoy utilizando el paquete R nlme y el gls función.
Pregunta 1
El GLS modelos de los residuos sigue siendo la pantalla casi idénticos patrones cíclicos, cuando conspiró contra el tiempo. Estos patrones de siempre, incluso en los modelos que explicar con precisión la estructura de autocorrelación?
He simulado algunos simplificado, pero similares de datos en R debajo de mi segunda pregunta, que muestra el problema basado en mi entendimiento actual de los métodos necesarios para evaluar temporalmente autocorrelated patrones en el modelo de los residuos, que ahora sé que están equivocados (ver respuesta).
Pregunta 2
He montado GLS modelos de la mejor manera posible y plausible de correlación de estructuras con mis datos, pero no son la realidad sustancialmente mejor ajuste que el GLM sin ningún tipo de correlación estructura: sólo una GLS modelo es ligeramente mejor (AIC puntuación = 1.8 inferior), mientras que el resto tienen mayores valores de AIC. Sin embargo, este es sólo el caso cuando todos los modelos están equipados por REML, no ML, donde GLS modelos son claramente mucho mejor, pero entiendo que a partir de las estadísticas de los libros sólo se debe utilizar REML para comparar modelos con diferente correlación de las estructuras y los mismos efectos fijos por razones que no voy a detallar aquí.
Dada la claridad temporalmente autocorrelated la naturaleza de los datos, si no hay ningún modelo es incluso moderadamente mejor que la simple GLM ¿cuál es la forma más adecuada para decidir el modelo a utilizar para la inferencia, suponiendo que yo estoy usando un método adecuado (que finalmente se desea utilizar AIC comparar diferentes combinaciones variables)?
Q1 'simulación' explorando residual de los patrones en los modelos con y sin la adecuada correlación de estructuras
Generar la simulación y la respuesta de la variable con un efecto cíclico de 'tiempo', y un positivo efecto lineal de 'x':
time <- 1:50
x <- sample(rep(1:25,each=2),50)
y <- rnorm(50,5,5) + (5 + 15*sin(2*pi*time/25)) + (x/1)
y debe mostrar una tendencia cíclica sobre 'el tiempo' con la variación aleatoria:
plot(time,y)
Y una relación lineal positiva con la 'x' con la variación aleatoria:
plot(x,y)
Crear un modelo aditivo lineal simple de "y ~ + x":
require(nlme)
m1 <- gls(y ~ time + x, method="REML")
El modelo muestra clara patrones cíclicos en los residuos cuando se trazan en contra de 'el tiempo', como sería de esperar:
plot(time, m1$residuals)
Y lo que debería ser un agradable, clara, la falta de cualquier patrón o tendencia en los residuos cuando se trazan contra la 'x':
plot(x, m1$residuals)
Un modelo simple de "y ~ + x" que incluye un proceso autorregresivo de correlación estructura de orden 1 debe ajustarse a los datos mucho mejor que el anterior modelo, ya que de la autocorrelación de la estructura, cuando se evaluó el uso de AIC:
m2 <- gls(y ~ time + x, correlation = corAR1(form=~time), method="REML")
AIC(m1,m2)
Sin embargo, el modelo debe mostrar de manera casi idéntica 'temporalmente' autocorrelated residuales:
plot(time, m2$residuals)
Muchas gracias por cualquier consejo.