¿Cuál es la covarianza en un lenguaje sencillo y cómo se enlaza con los términos de la dependencia, de correlación y de varianza-covarianza de la estructura con respecto a medidas repetidas diseños?
Respuestas
¿Demasiados anuncios?La covarianza es una medida de cómo los cambios en una variable están asociados con los cambios en una segunda variable. Específicamente, la covarianza mide el grado en que dos variables están linealmente relacionadas. Sin embargo, también se utiliza a menudo de manera informal como una medida general de cómo monótonamente relacionado con dos variables. Hay muchas explicaciones intuitivas de covarianza aquí.
Con respecto a cómo la covarianza es relativa a cada uno de los términos que usted ha mencionado:
(1) la Correlación es una versión a escala de la covarianza que toma valores en $[-1,1]$, con una correlación de $\pm 1$ indicando perfecto lineal de la asociación y $0$ indicando que no hay relación lineal. Esta escala hace de correlación invariante a cambios de escala de las variables originales, (que Akavall puntos y da un ejemplo de, +1). La ampliación constante es el producto de las desviaciones estándar de las dos variables.
(2) Si dos variables son independientes, su covarianza es $0$. Pero, el tener un covarianza de $0$ no implica que las variables son independientes. Esta figura (de Wikipedia)
$ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $
muestra varios ejemplos de tramas de datos que no son independientes, pero sus covarianzas son $0$. Un importante caso especial es que si dos variables son conjuntamente normalmente distribuidos, entonces, son independientes si y sólo si ellos no están correlacionados. Otro caso especial es que los pares de bernoulli variables están correlacionadas si y sólo si son independientes (gracias @cardenal).
(3) La varianza/covarianza de la estructura (a menudo llamado simplemente la estructura de covarianza) en diseños de medidas repetidas se refiere a la estructura que se usa para modelar el hecho de que las mediciones repetidas en los individuos son potencialmente correlacionadas (y por lo tanto son dependientes) - esto se hace mediante el modelado de las entradas de la matriz de covarianza de las mediciones repetidas. Un ejemplo es el intercambiables correlación estructura con varianza constante que especifica que cada medición repetida tiene la misma varianza, y todos los pares de mediciones son igualmente correlacionados. Una mejor opción, puede especificar una estructura de covarianza que requiere dos mediciones más lejos en el tiempo para estar menos relacionadas (por ejemplo, un modelo autorregresivo). Tenga en cuenta que el plazo de la estructura de covarianza surge de manera más general en muchos tipos de análisis multivariante, donde las observaciones se les permite estar correlacionados.
Macro la respuesta es excelente, pero quiero añadir algo más a una cuestión de cómo la covarianza relativa a la correlación. La covarianza no nos dice realmente sobre la fuerza de la relación entre las dos variables, mientras que la correlación. Por ejemplo:
x = [1, 2, 3]
y = [4, 6, 10]
cov(x,y) = 2 #I am using population covariance here
Ahora vamos a cambiar la escala, y se multiplican ambos x e y por 10
x = [10, 20, 30]
y = [40, 60, 100]
cov(x, y) = 200
Cambiando la escala no debe aumentar la fuerza de la relación, así que se puede ajustar mediante la división de las covarianzas por desviaciones estándar de x y de y, que es exactamente la definición de coeficiente de correlación.
En ambos casos el coeficiente de correlación entre x y y es la 0.98198
.