Estoy trabajando con los dos pasos en el proceso de cluster en SPSS Modeler (Clementine), y tratando de conseguir un sentido de la función de distancia utilizada. Se trata de una función de verosimilitud logarítmica (como se indica en google docs), pero no estoy seguro de que incluso para las variables continuas (los controladores de función continua y variable nominal) cómo este es un registro de probabilidad (lo que falta es que la mayoría de los elementos de una Gaussiana). Abajo es una captura de pantalla de la documentación que describe la fórmula de la distancia.
Alguien ha visto a la derivación de esta función de distancia?