7 votos

¿Técnicas de reconocimiento de patrones en datos espaciales o espaciotemporales?

Trabajo con meteorólogos y tengo acceso a datos climatológicos históricos. Dadas las condiciones meteorológicas actuales en una zona de interés (es decir, el "mapa" actual), queremos intentar encontrar el "mapa" más similar a partir de los datos del pasado. La idea es intentar hacer una previsión meteorológica encontrando el mejor analógico a partir de datos anteriores.

Los datos se representan como una cuadrícula regular de puntos X por Y (es decir, una matriz), donde X es la posición horizontal e Y es la posición vertical, y el (X,Y)º valor de la matriz representa la variable de respuesta Z en esa posición. Además, los puntos de la cuadrícula están espaciados uniformemente. Por ejemplo, Z puede ser una medida de la temperatura de la superficie, que se mide en cada uno de los puntos de la cuadrícula.

Nos ocupamos de los efectos estacionales restringiendo la búsqueda en los datos del pasado a una ventana de +/- 15 días de la fecha de la prueba. Por ejemplo, si queremos encontrar el mejor análogo para un mapa de 2013-06-19, sólo tendríamos en cuenta los mapas de 2012-06-19 +/- 15 días, 2011-06-19 +/- 15 días, etc. También restringimos la búsqueda a las observaciones tomadas al mismo tiempo que la fecha de la prueba. Por ejemplo, si los datos de la prueba son una observación tomada a mediodía, sólo buscaremos los datos pasados tomados a la misma hora.

Tengo dos preguntas.

(1) Dadas dos cuadrículas (o "mapas" o matrices) de datos, ¿cuál es la mejor manera de calcular la similitud entre ellas? ¿Existen métodos que tengan en cuenta la naturaleza espacial de los datos? Por ejemplo, el punto (1,1) estará muy correlacionado con el punto cercano (1,2), etc.

Actualmente utilizo una métrica de distancia muy simple, en la que simplemente tomo la diferencia de los dos mapas y hallo la norma de Frobenius. El mapa del pasado que arroja el valor más pequeño es el mapa "más cercano" a las condiciones de la prueba.

(2) Soy nuevo en estadística espacial y estoy buscando bibliografía relacionada con lo que intento hacer. ¿Qué debería leer para familiarizarme con el trabajo con datos de cuadrículas? ¿Qué recursos existen para aprender sobre el reconocimiento de patrones en datos espaciales o espaciotemporales?

(Quiero mencionar que estoy trabajando en R, así que también agradecería recomendaciones de paquetes).

4voto

usεr11852 Puntos 5514

No tengo la respuesta de un libro de cocina, pero aquí van algunas ideas iniciales:

  • Creo que tu idea sobre la norma de Frobenius no es descabellada y puede servir como primera apuesta segura de hecho. Creo que se pueden utilizar diferentes métricas para las distancias matriciales, pero voy a proponer dos basadas en la naturaleza de los datos:

    1. Dado que lo que se busca en cada mapa climático es la realización de un 2D Proceso gaussiano en el espacio podría ser interesante estimar para cada mapa los hiperparámetros $\theta_{MAP}$ de ella. A continuación, puede tratar $\theta_{MAP}$ como conteniendo información sobre la dinámica subyacente de su proceso. Comparación de los vectores $\theta$ dará una idea de la similitud entre dos mapas cualesquiera. (Para empezar, una función de covarianza "estándar" como la suma de una exponencial cuadrada y un ruido gaussiano debería ser suficiente. Probablemente sería interesante pensar cómo "centraría a cero" sus mapas. Quizá tenga que consultar kriging un poco más de cuidado (entender la diferencia entre simple y ordinario kriging, por ejemplo, y verá inmediatamente a qué me refiero con "centrar en cero" sus mapas. (Dependerá de si ves que tus mapas proceden del mismo proceso estacionario o no).

    2. Trata todas las instancias del mapa como si fueran muestras del mismo modelo de avance. A continuación, se calculan los mapas propios y se comparan las diferencias observadas en las puntuaciones de proyección generadas por los mapas propios. La referencia más fácil para esto es... Eigenfaces . Realmente no es broma, basta con leer el artículo y cada vez que se lee " cara ", léase " mapa climático ". Todo está ahí. No te salgas del paso PCA; tu matriz de covarianza será $N \times N$ donde $N$ es el tamaño de la muestra, no el del mapa.

  • Kriging : Si trabaja en estadística espacial, es de vital importancia comprenderla. Todo lo demás se hace prácticamente en extensión o en paralelo a esta técnica principal. Entender qué es una variograma espectáculos y cómo leer uno. La literatura sobre regresión de procesos gaussianos también puede ser útil para una primera lectura; la RGP es esencialmente kriging simple y normalmente los textos que describen el GPR son menos técnicos. Para las referencias reales sobre la materia me referiré directamente a las instrucciones dadas por Peter Diggle al respecto:

Cressie (1991) sigue siendo una referencia estándar para los modelos y métodos estadísticos espaciales. Otras obras posiblemente más accesibles (...) son: los capítulos introductorios de Rue y Held (2005) sobre la variación espacial discreta, Diggle y Ribeiro (2007) sobre geoestadística y Diggle (2003) en procesos puntuales. Waller y Gotway (2004) cubren las tres subáreas a un nivel introductorio, centrándose en las aplicaciones de salud pública. Gelfand et al (2010) es una compilación editada que abarca modelos y métodos espaciales y espaciotemporales.

Para una visión de aprendizaje automático sobre los procesos gaussianos, me remito sin duda a Procesos gaussianos para el aprendizaje automático por Rasmussen y Williams. Personalmente he utilizado mucho los libros de Diggle & Ribeiro y de Rasmussen & Williams. Cressie tiene un montón de buenos artículos sobre el tema. No sé cuál es tu nivel de conocimientos matemáticos, pero es un tema divertido y creo que puedes avanzar con relativa facilidad. Al fin y al cabo, sólo hay que interpolar entre puntos. Suerte.

Ah, cuando se trata de software creo que ir a la CRAN Opciones de la vista de tareas en Temporal y EspacioTemporal es el mejor paso inicial.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X