Tengo un archivo de unos 4000 puntos, que corresponden a alrededor de 400 diferentes categorías (especies de plantas raras). Me gustaría eliminar duplicados dentro de las categorías (que podría ser la repetición de las observaciones de la misma población, en diferentes fechas o ligeramente diferentes de coordenadas).
¿Puedo realizar algún tipo de análisis de cluster, pero sólo dentro de cada especie? No quiero dividir en 400 capas! Lo ideal es que el límite de cada grupo sería de alrededor de 1000m, y si cada punto podría tener el ID de un clúster añadido como un atributo que sería perfecto. La elección de los puntos que descartar de cada grupo es difícil, ya que el año más reciente sería la mejor opción, pero algunos tienen las coordenadas registradas en mejor resolución que los otros, mientras que otros contienen información valiosa en la libre comentario de texto de atributo.
Soy relativamente nuevo en QGIS y probablemente no pueda usar Python/ métodos que implican el código sin un poco de ayuda seria!
Este es un ejemplo de el tipo de datos que estoy discutiendo (trabajo en el reino unido Ordnance Survey de Referencia de Cuadrícula) como se puede ver las tres primeras líneas están muy cerca el uno del otro sino que se registran en diferentes momentos. Quiero amalgamar estos/ identificarlos como un grupo (y eventualmente eliminar los mayores registros).