4 votos

Cómo hacer agrupación mensual de la recogida de datos?

Quiero clúster de 10 sitios diferentes en base a diferentes parámetros como la temperatura, la humedad, la lluvia, etc. para los datos mensuales recogidas durante un período de 2 años.

  1. Debo uso de los medios de todos los 24 de muestras de datos para cada parámetro o la totalidad de los conjuntos de datos?

  2. Por otra parte, estos parámetros están en diferente escala de medición: Es la normalización necesario en este caso? Si es así, ¿cómo lo haría?

  3. Por último, ¿existe un valor de corte para decidir el número de clusters en un dendrograma?

2voto

Chillie Puntos 281
  1. Así que usted está seguro de si:

    • para clúster de 240 puntos en 18 de espacio tridimensional o
    • clúster de 10 puntos (es decir, de 24 de observaciones) en el mismo 18 de espacio tridimensional?

    Yo iría por la agrupación de 240 puntos, porque la agrupación de 10 puntos en un espacio de alta dimensión tiene poco sentido. Supongo que su preocupación es que el mismo sitio podría terminar en diferentes grupos para diferentes períodos. Si es un problema en tu caso, puede asignar a cada sitio a uno de los clúster más frecuente número de clúster, por ejemplo.

  2. La estandarización es una buena manera de hacer que todas las dimensiones comparables, por lo que al calcular la distancia entre puntos que no han dominante dimensiones. También hay otra opción - para tomar 1-correlación absoluta como la distancia, entonces no necesita ningún tipo de estandarización.

  3. Usted podría decidir sobre el número de clusters o tratar de estimar por métodos diversos, utilizando la puntuación de la función , por ejemplo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X