Vamos a tener la plaza matriz simétrica de los cuadrados de las distancias euclídeas $\bf D$ $n$ puntos y vectores lengthed $n$, lo que indica cluster o grupo de pertenencia ($k$ clusters) de los puntos; un clúster puede consistir $\ge1$ punto.
¿Cuál es el más eficaz o muy eficaz (en términos de velocidad) forma de calcular las distancias entre el clúster de los centroides de aquí?
Hasta ahora siempre lo hice Principal Coordinar el análisis en esta situación. PCoA, o Torgerson del MDS asciende a primera conversión de $\bf D$ en la matriz de productos escalares $\bf S$ ("doble centrado") y, a continuación, realizar la PCA. De esta manera podemos crear las coordenadas de la $n$ puntos en el espacio euclidiano que abarcan. Después de eso, es fácil de calcular las distancias entre los centroides de la forma habitual - como lo harías con grouped points x variables
de datos. PCoA tiene que ver eigen-descomposición o de enfermedad vesicular porcina de la n x n
simétrica positiva semidefinite $\bf S$, pero $n$ puede ser bastante grande. Además, la tarea no es una reducción de dimensionalidad uno y que en realidad no necesitan de esas ortogonal de los ejes principales. Así que tengo una sensación de que estas descomposiciones podría ser una exageración.
Entonces, ¿tiene usted conocimiento o ideas acerca de una potencial forma más rápida?