7 votos

Correlación como medida de probabilidad

Las diversas formas de la correlación, por ejemplo, $r = \frac{\Sigma_i x_i * y_i}{\sigma_x \sigma_y}$ o $r = \frac{\Sigma_i (x_i-\bar{x}) * (y_i-\bar{y})}{\sigma_x \sigma_y}$ son populares las medidas de similitud en muchas aplicaciones.

Es no probabilística interpretación para este ejemplo que cualquiera de las $r$ o $r^2$ es un aproximado de la probabilidad de x e y viene de la misma o similar de distribución? es decir, si tenemos alguna forma de $P_{\theta_1}(x)$$P_{\theta_2}(y)$, $r$ está relacionado con $P(\theta_1=\theta_2 | x,y)$?

Me imagino que la correlación puede ser el primer término en la aproximación de algún tipo de una medida de probabilidad. Pero soy incapaz de llegar a un modelo. Asumiendo $x$ $y$ a venir de una normal, y $\theta$ siendo la media, realmente no se derivan de esa expresión.

2voto

user5289 Puntos 1342

Creo que hay un pequeño problema conceptual aquí: la probabilidad es la cantidad de $P(x,y|\theta)$ como una función de la $\theta$. Pero el coeficiente de correlación es una función de los datos de $x$$y$. El coeficiente de correlación es por lo tanto, por definición, una "estadística" (en función de los datos) y no una probabilidad (función de los parámetros).

Para decirlo de otra manera, no hay valores de $\theta$ para el cual la probabilidad de que la correlación observada sería alto, y otros valores de $\theta$ para que la correlación observada sería baja. Si usted tiene una correlación de Gauss en mente, entonces la correlación observada podría ser poco probable debido al hecho de que la matriz de covarianza fue más dependiente o menos dependiente de lo que cabría esperar a partir de los datos. (Así que la relación entre la probabilidad y el $r^2$ no van a ser menos monótono $r^2=1$). Por supuesto, a la espera que el coeficiente de correlación es monótonamente relacionados con la diagonal plazo en un bivariante de Gauss, pero eso no $r^2$ sí una proxy de la probabilidad.

Suena como que usted está interesado en una prueba de si un determinado coeficiente de correlación es probable que haya sido observado, dado que $x$ $y$ fueron generados de forma independiente. Para esto, es posible que desee realizar una significación de la prueba en el valor de la observó $r$ o $r^2$, que le dirá cómo de probable es que se observó que el valor de un modelo en particular de los datos. El artículo de la Wikipedia sobre el coeficiente de correlación de inferencia describe algunas pruebas comunes.

0voto

highBandWidth Puntos 977

Creo PCA hace algo cercano a un Guassian modelo de ruido que viene cerca de una correlación de medida en un espacio multidimensional.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X