Trabajo con meteorólogos y tengo acceso a datos climatológicos históricos. Dadas las condiciones meteorológicas actuales en una zona de interés (es decir, el "mapa" actual), queremos intentar encontrar el "mapa" más similar a partir de los datos del pasado. La idea es intentar hacer una previsión meteorológica encontrando el mejor analógico a partir de datos anteriores.
Los datos se representan como una cuadrícula regular de puntos X por Y (es decir, una matriz), donde X es la posición horizontal e Y es la posición vertical, y el (X,Y)º valor de la matriz representa la variable de respuesta Z en esa posición. Además, los puntos de la cuadrícula están espaciados uniformemente. Por ejemplo, Z puede ser una medida de la temperatura de la superficie, que se mide en cada uno de los puntos de la cuadrícula.
Nos ocupamos de los efectos estacionales restringiendo la búsqueda en los datos del pasado a una ventana de +/- 15 días de la fecha de la prueba. Por ejemplo, si queremos encontrar el mejor análogo para un mapa de 2013-06-19, sólo tendríamos en cuenta los mapas de 2012-06-19 +/- 15 días, 2011-06-19 +/- 15 días, etc. También restringimos la búsqueda a las observaciones tomadas al mismo tiempo que la fecha de la prueba. Por ejemplo, si los datos de la prueba son una observación tomada a mediodía, sólo buscaremos los datos pasados tomados a la misma hora.
Tengo dos preguntas.
(1) Dadas dos cuadrículas (o "mapas" o matrices) de datos, ¿cuál es la mejor manera de calcular la similitud entre ellas? ¿Existen métodos que tengan en cuenta la naturaleza espacial de los datos? Por ejemplo, el punto (1,1) estará muy correlacionado con el punto cercano (1,2), etc.
Actualmente utilizo una métrica de distancia muy simple, en la que simplemente tomo la diferencia de los dos mapas y hallo la norma de Frobenius. El mapa del pasado que arroja el valor más pequeño es el mapa "más cercano" a las condiciones de la prueba.
(2) Soy nuevo en estadística espacial y estoy buscando bibliografía relacionada con lo que intento hacer. ¿Qué debería leer para familiarizarme con el trabajo con datos de cuadrículas? ¿Qué recursos existen para aprender sobre el reconocimiento de patrones en datos espaciales o espaciotemporales?
(Quiero mencionar que estoy trabajando en R, así que también agradecería recomendaciones de paquetes).