5 votos

¿Puede derivarse la covarianza de las medias y las varianzas?

En los estudios de tratamiento es habitual informar de múltiples medidas de resultado de los mismos sujetos. Los efectos del tratamiento en estos resultados suelen estar correlacionados, por lo que esto debe tenerse en cuenta al modelar los datos. Sin embargo, los artículos sólo publican las medias y las desviaciones estándar antes y después de la intervención. Así, por ejemplo, un informe de tres pruebas:

> data.frame(mean.pre=c(1,5,100), sd.pre=c(0.2, 1, 10), mean.post=c(3, 2, 80), sd.post=c(0.3, 0.9, 11), rownames=c('test1','test2','test3'))
#       mean.pre sd.pre mean.post sd.post
# test1        1    0.2         3     0.3
# test2        5    1.0         2     0.9
# test3      100   10.0        80    11.0

... ¿sería posible calcular la matriz de covarianza 3 x 3 de las diferencias medias estandarizadas d = (mean.post - mean.pre)/sd.pre entre test1 , test2 y test3 ?

Información adicional: a veces la desviación estándar del cambio sd(mean.post-mean.pre) puede obtenerse a través de los estadísticos t y los valores p y, a veces, la correlación cor(mean.pre, mean.post) también se conoce. ¿Añade eso algo?

Si lo anterior no es suficiente para calcular las covarianzas, ¿podemos al menos poner un límite a las posibles covarianzas dados estos datos?

6voto

Horst Grünbusch Puntos 2742

El mejor límite que se puede obtener se debe a una variante de la desigualdad de Cauchy-Schwarz: $$|Cov(X,Y)| \leq \sqrt{Var(X) \cdot Var(Y)}$$

Por supuesto, esto es muy amplio, ya que la covarianza puede ser negativa, pero el lado derecho es siempre positivo. Garantiza que el $2 \times 2$ -matriz de covarianza entre $X$ y $Y$ es semidefinido positivo. Me temo que la información adicional no mejora mucho, porque ahora tienes una $4 \times 4$ -matriz de covarianza donde se tiene la $2 \times 2$ bloques diagonales conocidos pero en el otro lado ahora 4 covarianzas desconocidas que pueden ser elegidas arbitrariamente mientras la matriz de covarianzas completa siga siendo semidefinida positiva. (Ya pensaré en una prueba).

Sugiero que se pregunte a los autores. Si no pueden responder, de todos modos publicaron una ciencia deficiente y puedes descartar incluso las medias y las desviaciones estándar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X