7 votos

la creación de grupos de puntos con los mismos atributos

Tengo un archivo de unos 4000 puntos, que corresponden a alrededor de 400 diferentes categorías (especies de plantas raras). Me gustaría eliminar duplicados dentro de las categorías (que podría ser la repetición de las observaciones de la misma población, en diferentes fechas o ligeramente diferentes de coordenadas).

¿Puedo realizar algún tipo de análisis de cluster, pero sólo dentro de cada especie? No quiero dividir en 400 capas! Lo ideal es que el límite de cada grupo sería de alrededor de 1000m, y si cada punto podría tener el ID de un clúster añadido como un atributo que sería perfecto. La elección de los puntos que descartar de cada grupo es difícil, ya que el año más reciente sería la mejor opción, pero algunos tienen las coordenadas registradas en mejor resolución que los otros, mientras que otros contienen información valiosa en la libre comentario de texto de atributo.

Soy relativamente nuevo en QGIS y probablemente no pueda usar Python/ métodos que implican el código sin un poco de ayuda seria!

Este es un ejemplo de el tipo de datos que estoy discutiendo (trabajo en el reino unido Ordnance Survey de Referencia de Cuadrícula) como se puede ver las tres primeras líneas están muy cerca el uno del otro sino que se registran en diferentes momentos. Quiero amalgamar estos/ identificarlos como un grupo (y eventualmente eliminar los mayores registros).

table of data I would like

1voto

ESV Puntos 4591

Usted quiere mirar la Agrupación Jerárquica para construir sus clusters. Esto le permitirá especificar un tamaño de clúster basado en la distancia de intereses (es decir, 1000m), en lugar de un número de clusters o un número de puntos dentro del clúster.

(Enchufe descarado) he construido un QGIS Procesamiento plugin para poner en práctica la agrupación de la scipy biblioteca: Scipy Punto de la Agrupación. En este plugin es una herramienta para la Agrupación Jerárquica por Identificador de donde puede seleccionar una columna en el punto del conjunto de datos para garantizar que sólo cuenta con el mismo identificador se agrupan juntos. En su caso podría utilizar la especie, por ejemplo. A continuación, le agregue una etiqueta de campo para el conjunto de datos con un ID de clúster.

Yo recomiendo jugar con la vinculación método cuando la construcción de los clusters. La mayoría del tiempo single o complete son los que más útil me parece;

  • single vinculación dice que los puntos serán agrupados juntos si un punto es un máximo de la tolerancia para cualquier otro punto en el clúster
  • complete vinculación requiere que todos los puntos del clúster están dentro de la tolerancia de distancia el uno del otro

Hay detalles de los otros parámetros en la herramienta en la ayuda, aunque yo no tienden a ajustar esos como mucho.

0voto

erikvold Puntos 244

Usted puede utilizar un espacio de base de datos como PostgreSQL/PostGIS. ¿Desea algo así como los siguientes datos ? enter image description here

Y eliminar los datos cuando la distancia es menor de 1000 metros ?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X