15 votos

¿Existe una caracterización intuitiva de la correlación de distancias?

He estado mirando la página de wikipedia para correlación de distancias donde parece que se caracteriza por la forma en que se puede calcular. Aunque podría hacer los cálculos me cuesta Obtenga qué mide la correlación de distancias y por qué los cálculos son como son.

¿Existe una (o muchas) caracterización más intuitiva de la correlación de distancia que pueda ayudarme a entender lo que mide?

Me doy cuenta de que pedir intuición es un poco vago, pero si supiera qué tipo de intuición estaba pidiendo probablemente no habría preguntado en primer lugar. También me encantaría que me dieran una intuición sobre el caso de la correlación de distancia entre dos variables aleatorias (aunque la correlación de distancia se define entre dos vectores aleatorios).

8voto

Uri Puntos 111

Esta mi respuesta no responder correctamente a la pregunta. Por favor, lea los comentarios.

Comparemos covarianza habitual y covarianza de la distancia . La parte efectiva de ambos son sus numeradores. (El numerador de la covarianza es el producto cruzado sumado (= producto escalar) de las desviaciones de un punto, la media: $\Sigma (x_i-\mu^x)(y_i-\mu^y)$ (con superíndice $\mu$ como ese centroide). Para reescribir la expresión en este estilo: $\Sigma d_{i\mu}^x d_{i\mu}^y$ con $d$ que representa la desviación del punto $i$ del centroide, es decir, su distancia (con signo) al centroide. La covarianza se define por la suma de los productos de las dos distancias sobre todos los puntos.

Cómo son las cosas con covarianza de la distancia ? El numerador es, como usted sabe, $\Sigma d_{ij}^x d_{ij}^y$ . ¿No es muy parecido a lo que hemos escrito arriba? ¿Y cuál es la diferencia? Aquí, la distancia $d$ está entre variar puntos de datos y no entre un punto de datos y la media, como en el caso anterior. La covarianza de la distancia se define por la suma de los productos de las dos distancias sobre todos los pares de puntos.

Producto escalar (entre dos entidades - en nuestro caso, variables $x$ y $y$ ) basado en la codistancia de un punto fijo se maximiza cuando los datos se disponen a lo largo de una línea recta . El producto escalar basado en la codistancia de un punto var*i*able se maximiza cuando los datos se disponen a lo largo de una línea recta localmente, a trozos; en otras palabras, cuando los datos en conjunto representan cadena de cualquier forma , dependencia de cualquier forma.

Y de hecho, la covarianza habitual es mayor cuando la relación está más cerca de ser lineal perfecta y las varianzas son mayores. Si se estandarizan las varianzas a una unidad fija, la covarianza depende sólo de la fuerza de la asociación lineal, y entonces se llama Pearson correlación . Y, como sabemos -y acabamos de intuir por qué-, la covarianza de la distancia es mayor cuando la relación está más cerca de ser una curva perfecta y la dispersión de los datos es mayor. Si se estandarizan los diferenciales a una unidad fija, la covarianza depende sólo de la fuerza de alguna asociación curvilínea, y entonces se llama Browniana (distancia) correlación .

0 votos

El segundo párrafo hizo que me diera cuenta. No sé por qué no vi eso en la página de la wikipedia... Gracias.

0 votos

Sólo me preguntaba, ¿en qué parte de es.wikipedia.org/wiki/Covarianza_coroniana#Covarianza_de_distancia ¿es el numerador de tu ejemplo (o cómo llegar desde tu numerador a la versión de wikipedia)? Wikipedia sólo describe cómo calcular el cuadrado de la covarianza de la distancia y estoy teniendo un poco de problemas para hacer coincidir su descripción con la descripción allí...

0 votos

@Rasmus, mi "fórmula del numerador" coincide con la fórmula de la wikipedia de la covarianza de la distancia muestral al cuadrado. Pero se me escapó un matiz (importante) que las distancias $d$ se transforman mediante un doble centrado. Por lo tanto, es posible que tenga que editar mi respuesta. Espero encontrar tiempo para volver en pocos días, si no mañana.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X