10 votos

Cómo cuadrícula de manera desigual muestreados datos categóricos?

Estoy buscando un método para la disposición en cuadrícula de datos categóricos. He extraído de las cartas náuticas y hojas de campo en una colección de puntos que se especifique la naturaleza de la superficie del fondo del océano. Estos datos son categóricos en lugar de numérica y que no son regularmente ni siquiera se tomaron muestras al azar. Las cartas náuticas son creados para facilitar la navegación y el fondeo; no se crean para mapa de hábitat. Como tal, más los sondeos se realizan cerca de la costa donde son relativamente poca profundidad puede representar un peligro para la navegación y en el que los barcos suelen ancla. Más lejos de la costa, donde las profundidades son más que adecuados para la navegación y el fondeo es poco práctico, los sondeos se hacen con mucho menos frecuencia.

Ha nadie trató de crear cuadrícula sustrato mapas de cartas náuticas?

Miré a Thiessen (Vornoi) polígonos, pero la concentración de los sondeos a lo largo de las costas conduce a una multa 'nido de abeja' a lo largo de la costa, los grandes polígonos de la costa y en el entre tiempo pastel en forma de polígonos de estiramiento camino de la costa. Disposición en cuadrícula utilizando vecino más cercano rendimientos prácticamente el mismo resultado.

Necesito una manera de limitar la influencia de las poco profundas cerca de la costa puntos, una manera de limitar los largo de pastel en forma de polígonos. En aguas más profundas no creo que la naturaleza de la parte inferior será una continuación de la cerca de la orilla inferior. Empecé a pensar a lo largo de dos líneas, tanto el uso de la profundidad. Uno es la ponderación de la elección de la 'más cercano' al prójimo mediante la diferencia de profundidad entre una celda de la cuadrícula y los puntos vecinos. Otro es el de la selección de puntos vecinos que son más de lo que algunos tolerancia especificada diferentes en profundidad. O, tal vez, antes que una tolerancia especificada, yo podría bin gamas de profundidad y, a continuación, limitar la elección de los puntos vecinos a los que en el mismo rango de profundidad o de reciclaje.

Alguna idea sobre cómo implementar cualquiera de estas dos opciones?

Ya hablando con los colegas en otros foros, he estado mirando un par de otros enfoques. La primera implica el uso de una barrera -- los 100 metros de profundidad contorno -- para limitar la influencia de la cerca de la costa de datos. El reto con este enfoque es que cualquiera de los ESRI interpolación de rutinas que se pueden utilizar barreras están diseñados para trabajar con datos continuos en lugar de discontinuo de datos. Podría utilizar las barreras a romper los puntos en poco profundas cerca de la costa y más profundo puntos antes de la creación de polígonos de Thiessen. Sin embargo, preveo rampante efectos de borde desde ArcGIS createsThiessen polígonos de áreas rectangulares no para zonas complejas.

El segundo enfoque-sugerido por varios colegas -- fue kriging. Yo inicialmente había despedido de kriging de mano, ya que sólo se han considerado para datos continuos. El reto con el kriging es que no está diseñado para datos categóricos. Ahora, estoy mirando cokriging con la profundidad y la naturaleza de la superficie, pero, de cualquier tipo de kriging va a implicar el uso de un número entero códigos numéricos para la naturaleza de la superficie. Después de esto el resultado de punto flotante de códigos numéricos que tendrá que ser reducido de nuevo a la original entero de codificación. No es bonita.

¿Se puede sugerir otras líneas a seguir? (Uno podría, tal vez, el uso de análisis de terreno. Por ejemplo, una pendiente que el ángulo de reposo no podía ser de sedimentos. Estoy buscando algo más simple y, en cualquier caso, no tengo los datos a una resolución espacial suficiente.)

Saludos,

13voto

cjstehno Puntos 131

El kriging enfoque, si se implementa adecuadamente, es prometedor.

Como punto de partida, mira el "lineal generalizado modelos geoestadísticos" descrito por Diggle & Ribeiro en el Modelo basado en la Geoestadística (Springer, 2007). La idea subyacente es atractivo y flexible: un espaciales proceso estocástico (que es espacialmente continua) determina las distintas probabilidades de las categorías. Uno de los usos de la observada categorías irregular puntos para inferir propiedades estadísticas de que el proceso subyacente, incluyendo su correlación espacial de la estructura (variograma). Kriging, a continuación, crea una probabilidad de superficie consistente con las observaciones. En este punto usted puede realizar simulaciones geoestadísticas o usted puede hacer mapas relacionados con las probabilidades (tales como mapas de la máxima probabilidad de categorías, me imagino).

Esto suena sofisticado, y lo es. Sin embargo, Diggle y el Ribeiro de la discusión es bastante accesible, aunque es matemático y presupone algún conocimiento de la estadística, no se basan en gran medida en--y la mayoría de sus técnicas son implementadas en R paquetes que describen, geoR y geoRGLM. De hecho, es justo interpretar este libro como el manual para estos paquetes.

Como otros hilos en este sitio atestiguar, es relativamente fácil interfaz de R con datos del SIG (incluyendo shapefile y varios formatos de mapa de bits), por lo que no es un problema.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X