Distancia de correlación de Pearson: $$d_{cor}(x,y)=1- \frac{ \sum \limits_{i=1}^{n} (x_i-\bar{x})(y_i-\bar{y}) }{ \sqrt{ \sum \limits_{i=1}^{n} (x_i-\bar{x})^2 \sum \limits_{i=1}^{n} (y_i-\bar{y})^2 } }$$
Estoy utilizando el paquete 'factoextra' en R para calcular medidas de distancia de correlación. Esta es la tutorial . El conjunto de datos contiene 4 variables continuas (Asesinato, Asalto, UrbanPop, Violación), y aquí está el resultado de la distancia de correlación de Pearson:
Mi pregunta es, ¿cómo puede ser la distancia de correlación de 4 variables UN número exacto entre 0 y 2? Tal vez cada valor de distancia (Texas-Iowa) son la salida es el valor ponderado de 4 distancias (Asesinato, Asalto, UrbanPop, Violación), ¿no? No he podido encontrar la documentación de la función R. ¿Cuál sería la explicación racional a este problema?