Sabemos que una pareja t -es sólo un caso especial de ANOVA unidireccional de medidas repetidas (o dentro de un sujeto), así como de modelo lineal de efectos mixtos, que puede demostrarse con la función lme() del paquete nlme en R, como se muestra a continuación.
#response data from 10 subjects under two conditions
x1<-rnorm(10)
x2<-1+rnorm(10)
# Now create a dataframe for lme
myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2))
names(myDat) <- c("y", "x", "subj")
Cuando ejecuto la siguiente prueba t pareada:
t.test(x1, x2, paired = TRUE)
Obtuve este resultado (usted obtendrá un resultado diferente debido al generador aleatorio):
t = -2.3056, df = 9, p-value = 0.04657
Con el enfoque ANOVA podemos obtener el mismo resultado:
summary(aov(y ~ x + Error(subj/x), myDat))
# the F-value below is just the square of the t-value from paired t-test:
Df F value Pr(>F)
x 1 5.3158 0.04657
Ahora puedo obtener el mismo resultado en lme con el siguiente modelo, asumiendo una matriz de correlación simétrica positiva-definida para las dos condiciones:
summary(fm1 <- lme(y ~ x, random=list(subj=pdSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.3142115 9 -0.7918878 0.4488
# xx2 1.3325786 0.5779727 9 2.3056084 0.0466
U otro modelo, asumiendo una simetría compuesta para la matriz de correlación de las dos condiciones:
summary(fm2 <- lme(y ~ x, random=list(subj=pdCompSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.4023431 9 -0.618428 0.5516
# xx2 1.3325786 0.5779727 9 2.305608 0.0466
Con la prueba t emparejada y el ANOVA unidireccional de medidas repetidas, puedo escribir el modelo tradicional de media celular como
Yij = + i + j + ij, i = 1, 2; j = 1, ..., 10
donde i indexa la condición, j indexa el sujeto, Y ij es la variable de respuesta, es constante para el efecto fijo de la media global, i es el efecto fijo de la condición, j es el efecto aleatorio para el sujeto siguiente N(0, p 2 ) ( p 2 es la varianza de la población), y ij es residual después de N(0, 2 ) ( 2 es la varianza intra-sujeto).
Pensaba que el modelo de media de celda anterior no sería apropiado para los modelos lme, pero el problema es que no consigo un modelo razonable para las dos aproximaciones lme() con el supuesto de estructura de correlación. La razón es que el modelo lme parece tener más parámetros para los componentes aleatorios que los que ofrece el modelo de media celular anterior. Al menos el modelo lme proporciona exactamente el mismo valor F, grados de libertad y valor p, lo que gls no puede. Más concretamente, gls proporciona DF incorrectos debido a que no tiene en cuenta el hecho de que cada sujeto tiene dos observaciones, lo que lleva a DF muy inflados. Lo más probable es que el modelo lme esté sobreparametrizado al especificar los efectos aleatorios, pero no sé cuál es el modelo ni cuáles son los parámetros. Así que la cuestión sigue sin resolverse para mí.