7 votos

Cómo manejar la interpolación de varios (calidad) niveles irregulares de los datos?

Voy a tratar de proporcionar una descripción de alto nivel de la cuestión - al darse cuenta de que más información/info será necesario - pero no quiero escribir una novela que parece demasiado abrumador para la respuesta de la gente :)

Antecedentes:

Digamos que tengo 3 conjuntos (a, B, C) de irregulares de datos de punto de calidad variable; Una es "mejor" que la de B y B es "mejor" que el de C. Uno o más conjuntos de datos pueden tener datos para un punto dado.

Objetivo:

Crear una cuadrícula/mapa que contiene el "mejor" posible de datos.

Ejemplo/Solución Posible:

El uso de algún tipo de inverso de la distancia ponderada algoritmo en combinación w/de alguna manera la ponderación de los mejores conjuntos de datos más que la inferior calidad de los conjuntos de datos.

Por favor, siéntase libre de publicar las preguntas de seguimiento como sé que mi post original es bastante vago. Gracias de antemano.

6voto

cjstehno Puntos 131

Cuando "mejor" se interpreta como "mínima varianza del estimador imparcial", entonces la respuesta es cokriging. Esta técnica vistas de los tres conjuntos de datos como realizaciones de tres correlación espacial de los procesos estocásticos. Se caracteriza el proceso y sus correlaciones por medio de un análisis preliminar, "variografía." La variografía puede ser informados por otras consideraciones tales como la calidad relativa de los conjuntos de datos: esto haría que el analista que prefiere modelos de variograma que asignar mayores variaciones a la baja calidad de los conjuntos de datos. A continuación, el co-kriging propio algoritmo utiliza los datos y la variographic de salida (un conjunto de "pseudo co-variogramas") para predecir cualquier combinación lineal de los tres conjuntos de datos (tales como la media de los valores del conjunto de datos "A" dentro de lo especificado las celdas de la cuadrícula).

Un simple, la limitación de la versión de co-kriging , que supone en los tres conjuntos de datos no están correlacionados unos con otros. En este caso, cada uno de los conjuntos de datos se pueden kriged por separado. (Esto significa que un modelo de variograma se ajuste a cada conjunto de datos por separado y utilizar por separado para interpolar los valores de los datos en una cuadrícula de ubicaciones especificadas.) El kriging salida incluye una varianza de kriging. Suponiendo que cada conjunto de datos que representa la misma cantidad física, la pregunta es: ¿cómo combinar los tres valores estimados en cada punto de la cuadrícula en el "mejor" posible estimación de la cantidad. La respuesta es tomar un promedio ponderado de las tres estimaciones, el uso de los recíprocos de los kriging desviaciones como las pesas. El resultado sigue siendo imparcial, porque las tres entradas están sesgadas por la construcción; ponderación inversamente por la varianza asegura el resultado tiene la menor varianza, que es exactamente lo que "mejor" se supone que significa.

Kriging y co-kriging están disponibles en el Geostatistical Analyst add-on para ArcGIS (por un coste extra) y en software de libre acceso, tales como el gstat paquete de R. Estas no son las actividades a realizar, de manera casual: son sofisticados, un amplio análisis de los datos que son válidos sólo como resultado de una razonada, precisa caracterización estadística. Aunque el software de kriging y co-kriging siempre ha estado disponible en muchos entornos SIG, en mi humilde opinión kriging es no una actividad para ser realizada únicamente por un analista SIG, debido a que se requiere de una estrecha colaboración tanto con un experimentado estadístico y un experto en el campo de estudio. (De vez en cuando dos de estas tres funciones, o incluso los tres pueden ser debidamente llenadas por la misma persona, pero esto es raro.) Es uno de esos especialmente peligroso funciones de un SIG porque kriging de salida es fácilmente creados por cualquier persona que pueda empujar los botones de la derecha (una tarea que puede ser aprendido en 30 minutos con ESRI excelente tutorial sobre Geostatistical Analyst, por ejemplo) y a menudo look correcto, pero es sólo el "GO" parte de la proverbial GIGO.

0voto

Richard C. McGuire Puntos 3345

Una cosa que se me ocurre es el uso de la simulación. Para cada una de las observaciones que tienen una distribución de probabilidad, por ejemplo, una distribución normal. Por la mala calidad de las observaciones de estas distribuciones de probabilidad son más grandes. De cada una de estas observaciones se puede dibujar una realización de la prob. de distribución, de interpolar los valores, lo que resulta en un mapa. Hacer esto un par de miles de veces se obtiene una distribución de probabilidad para cada gridpoint en el inteprolation. A partir de esto se puede extraer por ejemplo la media. Además, puede utilizar las distribuciones de probabilidad en la interpolación gridpoints para obtener una estimación de la incertidumbre en cada ubicación. Usted probablemente no puede dibujar los valores independientes en sus observaciones, sino que tiene que dibujar con un espacial de dependencia entre los puntos.

No estoy seguro de cómo funcionaría desde un punto de vista estadístico utilizando, por ejemplo, kriging, es decir, es la prob. su distribución en la interpolación de puntos válidos dado todos los supuestos estadísticos en las realizaciones de los puntos de entrada.

Este tipo de cosas, probablemente, puede ser más fácil de hacer en un entorno de programación tales como el R o matlab.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X