esta pregunta comenzó como "la Agrupación de datos espaciales en R" y ahora se ha trasladado a DBSCAN pregunta.
Como las respuestas a la primera pregunta sugerida he buscado información acerca de DBSCAN y la lectura de algunos documentos sobre. Han surgido nuevos problemas.
DBSCAN requiere de ciertos parámetros, uno de ellos es "a distancia". Como mis datos en tres dimensiones, la longitud, la latitud y la temperatura, que la "distancia" debo usar? qué dimensión está relacionada con la distancia? Yo digamos que debe ser la temperatura. ¿Cómo puedo encontrar la distancia mínima con R?
Otro parámetro es el número mínimo de puntos de neded para formar un clúster. ¿Hay algún método para encontrar ese número? Por desgracia no he encontrado.
Buscando por Google no he podido encontrar una R ejemplo para el uso de dbscan en un conjunto de datos similar a la mía, ¿sabes de algún sitio web con este tipo de ejemplos? Por lo que puedo leer y tratar de adaptar a mi caso.
La última pregunta es que mi primer R intento con DBSCAN (sin una adecuada respuesta a las anteriores preguntas) resultó en un problema de memoria. R dice que no se puede asignar vector. Empiezo con una de 4 km espaciado de la cuadrícula con 779191 puntos que termina en aproximadamente 300000 filas x 3 columnas (latitud, longitud y temperatura) cuando la extracción no es válido SST puntos. Cualquier sugerencia para solucionar este problema de memoria. No depende de mi equipo o en DBSCAN sí mismo?
Gracias por la paciencia de leer una larga y probablemente aburrido mensaje y por tu ayuda.