En los estudios de tratamiento es habitual informar de múltiples medidas de resultado de los mismos sujetos. Los efectos del tratamiento en estos resultados suelen estar correlacionados, por lo que esto debe tenerse en cuenta al modelar los datos. Sin embargo, los artículos sólo publican las medias y las desviaciones estándar antes y después de la intervención. Así, por ejemplo, un informe de tres pruebas:
> data.frame(mean.pre=c(1,5,100), sd.pre=c(0.2, 1, 10), mean.post=c(3, 2, 80), sd.post=c(0.3, 0.9, 11), rownames=c('test1','test2','test3'))
# mean.pre sd.pre mean.post sd.post
# test1 1 0.2 3 0.3
# test2 5 1.0 2 0.9
# test3 100 10.0 80 11.0
... ¿sería posible calcular la matriz de covarianza 3 x 3 de las diferencias medias estandarizadas d = (mean.post - mean.pre)/sd.pre
entre test1
, test2
y test3
?
Información adicional: a veces la desviación estándar del cambio sd(mean.post-mean.pre)
puede obtenerse a través de los estadísticos t y los valores p y, a veces, la correlación cor(mean.pre, mean.post)
también se conoce. ¿Añade eso algo?
Si lo anterior no es suficiente para calcular las covarianzas, ¿podemos al menos poner un límite a las posibles covarianzas dados estos datos?