Esta respuesta describe un método objetivo para medir discrepancias arbitrarias entre dos conjuntos de datos espaciales. Estas discrepancias pueden incluir desplazamientos de posición, cambios de forma y características presentes en un conjunto de datos pero no en otro. Esta respuesta no no proporcionan ningún medio para determinar cuál es "mejor", porque eso depende de mucho más que los datos y, en particular, depende de para qué se utilizarán los datos.
Antecedentes
Una buena base para un gran conjunto de estas mediciones se basa en la Transformación de la distancia euclidiana de cada conjunto de datos. De este modo, se considera que cada conjunto de datos representa una colección de puntos en el plano. Llamemos a estas colecciones B para las características azules y R para los rasgos rojos.
Para cualquier punto x en el plano, la transformada de distancia euclidiana de un conjunto de puntos A calcula el mayor límite inferior de las distancias entre x y A . Podemos pensar que esta transformación crea una "superficie" cuya altura a x es igual a la distancia más corta de x a A . Así, esta superficie tiene valles en todos los puntos de A donde su altura es cero, y se eleva con una pendiente de 1:1 alejándose de A . Está claro que la transformada de distancia determina a su vez A (o técnicamente su métrica cierre que en el caso de los conjuntos de datos del SIG es lo mismo que A ) como el conjunto de todos los puntos a una altura de cero. Así, la transformada de distancia capta completamente toda la información espacial de A que el SIG es capaz de representar.
Esta figura muestra las transformadas de distancia de B (a la izquierda) y R (a la derecha) en pseudorrelieve.
Comparación de dos conjuntos de datos
Para comparar B y R y superponer cada una con la transformada de distancia de la otra:
Los valores de la distancia se muestran como colores graduados desde el azul (cerca de 0) hasta el rojo.
El mapa de la izquierda, por ejemplo, muestra los puntos de B y los colorea en función de sus distancias a R . Las funciones de B y R se cambian en el mapa de la derecha.
Ya estos ayudan al ojo a hacer comparaciones: cada mapa muestra los puntos de un conjunto de datos y, por su uso del color, destaca los puntos que están lejos de cualquier punto del otro conjunto de datos. Tenga en cuenta que ambos Los mapas son necesarios para la comparación, porque cada uno muestra puntos que no están en el otro.
En los mapas detallados, el color puede ser difícil de ver, por lo que podemos optar por difuminarlo un poco para su presentación o evaluación visual:
Nota: Los colores no son comparables entre los dos mapas: dentro de cada mapa están escalados para mostrar toda la gama de distancias en ese mapa.
Análisis estadístico de las diferencias
La belleza de este enfoque reside en lo que se puede hacer en el post-procesamiento. Utilizar una trama para representar las transformaciones de distancia y sus superposiciones, podemos obtener fácilmente estadísticas -locales y globales- para medir las discrepancias. Por ejemplo, podríamos centrarnos en todas las distancias mayores que algún pequeño umbral y explorar su distribución de frecuencias:
En este histograma, las barras azules corresponden a las características azules y las rojas a las rojas. (Obsérvese la escala logarítmica en el eje horizontal.) Este histograma muestra los datos originales superpuestos, no los datos borrosos derivados. Se han seleccionado sólo las distancias mayores de tres píxeles en la imagen original.
Estos histogramas muestran que es mucho más probable que los rasgos azules estén lejos de los rojos que viceversa Las barras azules son más altas que las rojas y se extienden a mayores distancias (a la derecha). Ahora se dispone de todo un arsenal de estadísticas descriptivas para cuantificar las diferencias entre los dos conjuntos de datos. Estos estadísticos pueden aplicarse a toda la región de interés o "abrir una ventana" sobre ella para explorar cómo difieren los dos conjuntos de datos según su ubicación.
Aplicación
La mayoría de los SIG ráster proporcionan una transformación de distancia euclidiana (como Distancia euclidiana en ArcGIS y r.crecer.distancia en GRASS), y todos admiten la superposición simple (de enmascaramiento) necesaria para realizar este análisis. El desenfoque, si se desea, puede hacerse con una media de vecindad o una convolución de núcleo (que incluye el "desenfoque gaussiano" disponible en todos los programas de procesamiento de imágenes). La mayoría de los SIG hacen no proporcionan un soporte adecuado para el análisis estadístico completo de los datos rasterizados, pero son buenos para exportar dichos datos en formatos legibles por software estadístico y matemático como R
o Mathematica (que hizo todas las cifras aquí).