La covarianza de dos variables aleatorias $X$ y $Y$ se definición como el %#% $ #% no entiendo, si alguien me podría explicar esto por favor. ¿Por qué este valor nos hablan de alguna relación $${\rm Cov}(X,Y) = E[(X-E[X])(Y-E[Y])]. $ y $X$?
Respuestas
¿Demasiados anuncios?Considerar los casos especiales en que $X=Y$, y donde $X=-Y$. En el primer caso, $X-E[X]$ $Y-E[Y]$ siempre tienen el mismo signo, por lo que el producto siempre será positivo, como se esperaba; en el otro caso, el uno será positivo cuando el otro es negativo, y viceversa, de modo que el producto y la expectativa será negativa. Así que esto hace que la covarianza positiva si las cosas varían juntos, y negativo si varían de forma opuesta.
Lo que puede interesar es el coeficiente de correlación $$\rho_{XY} = {{\rm Cov}(X,Y)\over \sigma_X \sigma_Y.}$$ Si $\rho_{XY} = 1$, $X$ y $Y$ están relacionadas linealmente a través de una relación lineal con pendiente positiva. Si $\rho_{XY} = -1$, $X$ y $Y$ están relacionadas linealmente a través de una pendiente negativa. Si $X$ $Y$ son independientes $\rho_{XY} = 0$ (cuidado: el recíproco NO es cierto).
Asumir la X y la Y - los datos en una matriz de 2 filas y n columnas.
Supongamos ahora, que cada columna se define una nueva dimensión en la n -dimensional en el espacio euclidiano. Por ejemplo, si n es 2, entonces X así como Y tiene dos coordenadas y puede dibujar vectores en el plano desde el origen hasta los puntos extremos X y Y. Se puede ver que el ángulo entre los vectores físicamente si se dibuja en su papel. Si n=3 , se tiene un espacio tridimensional y los dos vectores que se encuentran en el espacio, pero todavía se puede imaginar a los vectores y su ángulo.
Generalizar esta de n-dimensiones. La correspondiente relación para nosotros es el ángulo entre los vectores. Pero este ángulo puede ser expresada por el coseno y la fórmula del coseno es sólo la de la correlación (reescalado de covarianza) y después de la media se resta.
Hay dos aspectos más relevantes:
a) La eliminación de la media es sólo convención: con la idea de correlación/covarianza queremos que la masa de simultane desviación de la media/valor esperado - por lo que el origen de los vectores es traducido a la media general
b) si las observaciones/medidas en X resp en Y son estadísticamente "no independiente" muestreadas, entonces podemos asumir que el espacio euclídeo como no ortogonal, es decir, con la manera de sesgar/oblicua ejes. Esto indica también, cómo esos datos podría ser "orthogonalized" para eliminar esa dependencia (al menos en principio)