Enfoque 1. Compara todos los de la serie de 292 clúster de particiones directamente de control interno de calidad (ver pt 3 aquí).
Una manera de comparar las soluciones de clúster es aplicar algunas de validez interna de la agrupación criterio (que son muchas). Por lo general hacer que seleccionar el "mejor" número de clusters. Sin embargo, esos mismos criterios se puede utilizar para elegir el "mejor" método de partición o en el mejor de particiones del conjunto de datos de objetos.
En relación a esto último, permítanme citar un documento que describe algunos de estos clústeres de criterios (ver la colección de "agrupación de criterios" en mi página web"):
Uso: la comparación no idénticos conjuntos de objetos. Esto es posible. Uno debe entender que para que una agrupación criterio de objetos "i" en
el conjunto – son sólo anónimo filas. Por lo tanto, será correcto
comparar, por el criterio de valor, particiones P1 y P2 que en parte o
por completo se compone de no los objetos mismos. Al hacerlo, k puede ser
uno o diferentes en las particiones. Sin embargo, si P1 y P2, que consisten en
diferente número de objetos que uno puede usar un criterio sólo si es
insensible al número de objetos N.
En tu caso, tienes 73 conjuntos de objetos - 73 matrices de correlación. (Puede ignorar que las filas y las columnas de todas las matrices que representan a las mismas partes del cerebro: ya que los individuos son diferentes, que es de 73 conjuntos diferentes de algunos de los objetos.) Es importante y agradable que el "calibre" de la 73 conjuntos de datos es la misma: es la correlación de los valores, que son directamente comparables entre los conjuntos. También el tamaño de los conjuntos (matrices) es el mismo, así que usted puede utilizar cualquier agrupación criterio, no sólo "insensible a N". Ya que la cita va, k (número de grupos) pueden ser diferentes.
Así, seleccione uno o varios criterios de agrupación en clústeres de usar (que podría ser, es decir, C-índice o Dunn; pero dado que la r de Pearson es convertible a la distancia euclidiana usted puede utilizar casi cualquier criterio, cualquier usted encontrará que vale la pena). Y comparar la serie de 73*4 (4 diferentes k) = 292 particiones para su validez interna.
Observar los resultados de la parcela el criterio de los valores, de producir estadísticas de resumen). Lo de las particiones han tendido a ser el "mejor"? Tal vez la mayoría de los 73 3-soluciones de clúster prevalecer entre los mejores? Entonces se puede decir k=3 debe ser elegido por todos los 73 sujetos. O tal vez hay pocos temas cuya clúster resultados sugieren diferentes k? o no es bueno k en todos (los temas con una clara estructura de cluster)?
Enfoque 2. Clúster de la 73 matrices por su similitud en primer lugar.
Considere la posibilidad de cada sujeto (matriz de correlación) como un objeto para la agrupación de tareas. Ya que todas las matrices son del mismo tamaño, medida (correlación) y los elementos (las mismas partes del cerebro) se puede calcular una similitud/distancia medida entre ellos como los conjuntos de datos y el conjunto de ellos. Aquellos que resultó ser bastante similares, lo que podría ser visto como "un sujeto" podría promedio en una sola matriz. En consecuencia, usted termina con menor número de matrices, tipos de objetos (por ejemplo, 20) para el clúster en cada uno de los de entonces. Mejor número de clusters k, seguros, no ha de ser necesariamente el mismo para los de más de 20 conjuntos de datos, ya que ellos son a sabiendas, bastante diferentes estructuras. Que era un poco contundente, aún potencialmente útiles enfoque.