Tengo un set de temperatura superficial del mar (SST) datos mensuales y quiero aplicar algunos de racimo metodología para detectar las regiones con similares patrones de SST. Tengo un conjunto de datos mensuales de los archivos que se ejecutan desde el año 1985 hasta año 2009 y desea aplicar clustering para cada mes, como un primer paso.
Cada archivo contiene la cuadrícula de datos para 358416 puntos donde aproximadamente el 50% son de tierra y están marcados con un 99.99 valor que va a ser NA. Formato de datos:
lon lat sst
-10.042 44.979 12.38
-9.998 44.979 12.69
-9.954 44.979 12.90
-9.910 44.979 12.90
-9.866 44.979 12.54
-9.822 44.979 12.37
-9.778 44.979 12.37
-9.734 44.979 12.51
-9.690 44.979 12.39
-9.646 44.979 12.36
He intentado CLARA método de agrupación y de algunos aparentemente buenos resultados, pero también me parece que es sólo suavizado (agrupación) isolíneas. Entonces yo no estoy seguro de que este es el mejor método de agrupamiento analizar datos espaciales.
¿Hay algún otro método de agrupación dedicada a este tipo de conjuntos de datos? Alguna referencia sería bueno empezar a leer.
Gracias de antemano.