Yo estaba tratando de encajar uno de los datos de series de tiempo (sin repeticiones) utilizando el modelo de regresión. Los datos se ve como sigue:
> xx.2
value time treat
1 8.788269 1 0
2 7.964719 6 0
3 8.204051 12 0
4 9.041368 24 0
5 8.181555 48 0
6 8.041419 96 0
7 7.992336 144 0
8 7.948658 1 1
9 8.090211 6 1
10 8.031459 12 1
11 8.118308 24 1
12 7.699051 48 1
13 7.537120 96 1
14 7.268570 144 1
Debido a la falta de replica, yo tratar el tiempo como variable continua. La columna de "tratar" muestra el caso y los datos de control, respectivamente.
En primer lugar, yo encajaba en el modelo de "valor = tiempo*tratar" con "lm" en R
:
summary(lm(value~time*treat,data=xx.2))
Call:
lm(formula = value ~ time * treat, data = xx.2)
Residuals:
Min 1Q Median 3Q Max
-0.50627 -0.12345 0.00296 0.04124 0.63785
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8.493476 0.156345 54.325 1.08e-13 ***
time -0.003748 0.002277 -1.646 0.1307
treat -0.411271 0.221106 -1.860 0.0925 .
time:treat -0.001938 0.003220 -0.602 0.5606
El pvalue de tiempo y tratar no es significativo.
Mientras que con anova, me dieron diferentes resultados:
summary(aov(value~time*treat,data=xx.2))
Df Sum Sq Mean Sq F value Pr(>F)
time 1 0.7726 0.7726 8.586 0.0150 *
treat 1 0.8852 0.8852 9.837 0.0106 *
time:treat 1 0.0326 0.0326 0.362 0.5606
Residuals 10 0.8998 0.0900
El pvalue por el tiempo y tratar cambiado.
Con la regresión lineal, si estoy en lo cierto, significa que el tiempo y el tratamiento no tiene influencia significativa en el valor, pero con ANOVA, significa que el tiempo y el tratamiento tiene una influencia significativa en el valor.
Podría alguien explicarme por qué hay diferencia en estos dos métodos, y cual usar?