¿Existen reglas rígidas sobre qué métodos de interpolación son adecuados para cada tipo de datos raster?
En comentarios en gis.stackexchange.com/questions/17328/ .
¿Existen reglas rígidas sobre qué métodos de interpolación son adecuados para cada tipo de datos raster?
Una aclaración a la pregunta indica que métodos de remuestreo de una trama se buscan. Muchas de ellas se utilizan en fotográfico comunidades. Sin embargo, para el trabajo con SIG se utilizan habitualmente varios métodos sencillos:
Remuestreo del vecino más próximo . A cada celda del nuevo ráster se le asigna el valor de la celda más cercana (de centro a centro) del ráster original. Utilícelo para datos categóricos como el uso del suelo y otras clasificaciones.
Interpolación bilineal . A cada celda de la nueva trama se le asigna un promedio basado en las cuatro celdas originales más cercanas. El promedio es lineal en las direcciones horizontal y vertical. (Sin embargo, la fórmula resultante es no lineal; en realidad es cuadrático). Esto es bueno para el suavizado general, pero el promedio que se hace suele recortar un poco los picos y valles locales.
Convolución cúbica . Esto es similar en espíritu a la interpolación bilineal, pero puede extrapolar ligeramente los valores de las celdas cercanas. Lo hace con la intención de reproducir los promedios locales y la variabilidad en la nueva malla; en particular, el recorte de los extremos locales no debería ser tan severo. (Una consecuencia adversa, evidente como un error en ArcGIS de ESRI, es que los valores de la nueva cuadrícula pueden extenderse más allá del rango de la antigua, provocando que algunos de los nuevos extremos no se representen correctamente. Pero esto es sólo una cuestión de visualización de datos). La contrapartida es que la convolución cúbica tarda un poco más en calcularse que la interpolación bilineal.
Estos dos últimos métodos se tratan con detalle en http://www.quantdec.com/SYSEN597/GTKAV/section9/map_algebra.htm
Para cálculos rápidos y puntuales, suelo contentarme con la interpolación bilineal (para datos continuos) o la interpolación del vecino más próximo (para datos categóricos). Para todos los demás, especialmente cuando se preparan conjuntos de datos maestros o cuando se prevén manipulaciones extensas, recomiendo utilizar la convolución cúbica (así como pensar en ordenar las operaciones para minimizar la propagación del error de coma flotante).
El enlace a la página Map Algebra está roto, pero se puede acceder a través de Archive.org en web.archive.org/web/20130528031915/http://www.quantdec.com/
Según ESRI, los métodos de interpolación disponibles (disponibles como herramientas en Spatial Analyst y otras extensiones) se comparan del siguiente modo: (Cita)
IDW (Inverse Distance Weighted) utiliza un método de interpolación que estima los valores de las celdas promediando los valores de los puntos de datos de muestra en la vecindad de cada celda de procesamiento. Cuanto más cerca esté un punto del centro de la celda que se está estimando, más influencia, o peso, tendrá en el proceso de promediado.
Kriging es un procedimiento geoestadístico avanzado que genera una superficie estimada a partir de un conjunto disperso de puntos con valores z. Más que otros métodos de interpolación admitidos por ArcGIS Spatial Analyst, antes de seleccionar el mejor método de estimación para generar la superficie de salida debe realizarse una investigación exhaustiva del comportamiento espacial del fenómeno representado por los valores z.
Vecino natural La interpolación encuentra el subconjunto de muestras de entrada más cercano a un punto de consulta y les aplica pesos basados en áreas proporcionales para interpolar un valor (Sibson, 1981). También se conoce como interpolación de Sibson o de "robo de área".
En Spline utiliza un método de interpolación que estima los valores mediante una función matemática que minimiza la curvatura global de la superficie, lo que da como resultado una superficie lisa que pasa exactamente por los puntos de entrada.
Spline con barreras La herramienta Spline con barreras utiliza un método similar a la técnica utilizada en la herramienta Spline, con la diferencia principal de que esta herramienta honra las discontinuidades codificadas tanto en las barreras de entrada como en los datos de puntos de entrada.
En Topo a Raster y Topo a Raster por archivo utilizan una técnica de interpolación diseñada específicamente para crear una superficie que represente más fielmente una superficie de drenaje natural y preserve mejor tanto las líneas de cresta como las redes de arroyos a partir de los datos de contorno de entrada.
El algoritmo utilizado se basa en el de ANUDEM, desarrollado por Hutchinson et al en la Universidad Nacional de Australia.
Tendencia es una interpolación polinómica global que ajusta una superficie suave definida por una función matemática (un polinomio) a los puntos de muestra de entrada. La superficie de tendencia cambia gradualmente y capta patrones de escala gruesa en los datos.
También puede consultar este artículo: http://proceedings.esri.com/library/userconf/proc95/to100/p089.html
+1 por elegir algo de la ayuda de ESRI para citar que realmente tiene sentido y es correcto.
Estoy de acuerdo en que no hay reglas rígidas, pero sí algunas directrices para los distintos métodos de interpolación. Por ejemplo, IDW es mejor cuando se tienen puntos bastante densos para empezar. Kriging requiere mucho procesador y suele utilizarse en la modelización de suelos y geología. Spline se utiliza normalmente cuando se desea una superficie suave, por ejemplo, datos de temperatura. Algunos métodos mantienen la trama resultante pasando por los puntos originales, mientras que otros no.
Aunque está centrado en ArcGIS, en este documento de 4 páginas se ofrece una buena visión general de los distintos métodos.
Otros dos métodos serían Promedio4 y Promedio16. Hacen lo que parecen y toman la media de las 4 o 16 celdas circundantes.
En este caso se trata sobre todo de datos DEM. No se utilizaría en una imagen rasterizada (especialmente de 3 bandas de color).
No está ponderado por la distancia, pero no creo que lo utilice para raster (sólo vectorial), ya que la distancia en un conjunto de datos raster es un poco más subjetiva.
Siempre me he imaginado que Median4 y Median16 serían buenas formas de eliminar los picos de los datos DEM, aunque no conozco ningún paquete que lo permita.
Tu sugerencia de utilizar medianas de vecindario para detectar valores atípicos locales en los MDE es buena, Mark. El paquete GRID/Spatial Analyst de ESRI ha incluido medianas de vecindad durante mucho tiempo, sé que IDRISI puede hacerlo, y probablemente GRASS y Manifold también. Pero estos métodos no serían una buena elección para remuestrear una cuadrícula. Del mismo modo, los otros métodos que mencionas no tendrían buenas propiedades: efectivamente suavizan los datos originales a la resolución de la malla original, por lo que no deberían considerarse para el remuestreo en absoluto.
I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.
1 votos
¿Qué estás interpolando? ¿El objetivo es simplemente visualizar o medir realmente algún tipo de distribución? No te hagas ilusiones, prácticamente no hay reglas rígidas.
0 votos
La pregunta es demasiado vaga: ¿le interesa la interpolación de rásters o de vectores? Las decisiones no son arbitrarias, pero el problema es lo suficientemente amplio como para que el espacio no permita responder con una sola respuesta SE.
0 votos
Buena pregunta, y no es un duplicado, pero esta es similar. gis.stackexchange.com/questions/1903/
0 votos
@scw He aclarado la pregunta, espero que ahora sea un poco menos vaga :-)
4 votos
@ninesided: ¿Estás seguro de que querías indicar datos "rasterizados"? La respuesta que has aceptado se refiere únicamente a métodos de interpolación vector datos (puntuales y de línea).
0 votos
@whuber: lo siento, tal vez estoy confundiendo mi terminología. Tengo raster, quiero aumentar la resolución mediante interpolación. La respuesta que he seleccionado hace referencia interpolando rásters basados en características puntuales (que es lo que tengo) por lo que satisface mis necesidades, aunque también me gusta la respuesta de @Jakub
5 votos
El título de la pregunta es un poco ambiguo. Las palabras interpolación y remuestreo significan dos cosas ligeramente distintas. Interpolar es tomar una muestra de puntos de datos discretos (raster o vectoriales) y calcular una superficie continua a partir de ella. Remuestrear es tomar un grupo de puntos (de nuevo, raster o vectoriales), aplicarles algún tipo de algoritmo y producir un nuevo conjunto de puntos. Por tanto, creo que la interpolación puede considerarse un tipo de remuestreo.
0 votos
@Don Meltz: ¿cuál sería un título más apropiado? La interpolación no tiene por qué producir una superficie continua, ¿verdad? Sólo una de grano más fino.
2 votos
En mi opinión, el título es incorrecto. "Remuestrear datos ráster" me hace pensar que tienes un ráster y quieres producir un nuevo ráster más grande/pequeño a partir de él. Si desea producir una trama interpolando puntos vectoriales, "remuestreo" no es el término correcto.
3 votos
@ninesided - Puesto que has elegido mi respuesta como respuesta a tu pregunta, supongo que lo que buscabas era interpolar un conjunto de puntos discretos a una superficie ráster continua. La palabra remuestreo es interpretada por la mayoría como una conversión de una trama en otra, basada en algún algoritmo. No creo que te equivoques al utilizar la palabra, porque creo que la interpolación es una forma de remuestreo. Es sólo que la mayoría no lo ve así. No pretendo ser un experto en la materia, así que se aceptan correcciones a mis suposiciones.