Tanto el K-means y GMM necesita para ser capaz de calcular los medios (centroides), por lo que no puede funcionar en un determinado similarit de la matriz, es necesario definir una función para calcular una media, y una función de distancia de la media. Una matriz de similitud no es suficiente (en realidad, es inútil) para estos algoritmos.
Usted puede, sin embargo,
- el uso de un algoritmo de clustering que puede trabajar con diferentes distancias / similitudes, tales como la vinculación jerárquica de la agrupación, DBSCAN, la ÓPTICA, la PAM/k-Medoids
- el uso de Escalamiento Multidimensional a la aproximación de sus datos en un espacio vectorial Euclídeo, a continuación, ejecutar otros algoritmos de clustering de los datos proyectados. La interpretación de estos grupos va a ser mucho más difícil sin embargo.
Puede que desee ver en la avanzada de la agrupación marcos, tales como ELKI que ofrecen una amplia variedad de métodos. Por ejemplo, tal vez el subespacio agrupación o la correlación de la agrupación es la más adecuada para su problema.