13 votos

Análisis exploratorio de los errores de predicción espacio-temporal

Los datos: he trabajado recientemente en el análisis de las propiedades estocásticas de un espacio-temporal del campo de la producción de energía eólica errores de pronóstico. Formalmente, se puede decir que sea un proceso $$ \left (\epsilon^p_{t+h|t} \right )_{t=1\dots,T;\; h=1,\dots,H,\;p=p_1,\dots,p_n}$$ indizada dos veces en el tiempo (con $t$$h$) y una vez en el espacio ( $p$ ) $H$ el número de mirar hacia adelante veces (igual algo en torno a $24$, regularmente muestreada) , $T$ el número de "previsión de los tiempos" (es decir, momentos en los que el pronóstico es emitido, alrededor de 30000 en mi caso, regularmente muestreada), y $n$ es un número de posiciones espaciales (no tabulados, alrededor de 300 en mi caso). Dado que este es un tiempo relacionadas con el proceso, también tengo un montón de previsión del tiempo, el análisis, mediciones meteorológicas que se pueden utilizar.

Pregunta: ¿Puede usted me describe el análisis exploratorio de que se iba a realizar en este tipo de datos para comprender la naturaleza de la interdependencia de la estructura (que puede no ser lineal) del proceso con el fin de proponer una multa de modelado.

5voto

David Pokluda Puntos 4284

Nosotros (Un colega y yo) finalmente escribió un libro sobre eso. Para resumir las cosas que nosotros hemos propuesto dos soluciones para cuantificar y dar un resumen estadístico de la (espacio-temporal) de propagación de errores a lo largo de Dinamarca y a lo largo de mira por delante de los tiempos.

  • En el primero calculamos la correlación entre todos los pares de parques eólicos y para todos los pares de mirar hacia adelante veces (esta es una función de 4 variables). Cuando una pareja se fija, se demostró que la función de correlación tiene un máximo local a lo largo de mirar hacia adelante veces, nos dijo que esta es la propagación! La escala temporal asociado a un par de granjas de viento está dada por el desfase temporal para que este local es el máximo obtenido. Trazado, para todos los pares de viento de la granja de servidores local maxima de correlación, el desfase temporal que permite la obtención de la eso y de la estructura espacial del vector que une los parques eólicos da el lado derecho de la Figura 1.

Figure 1

Esto puede ser usado para calcular un mundial vector de propagación es decir, algún tipo de promedio espacial de las velocidades de propagación entre pares. Parte de esto se muestra en el lado izquierdo de la Figura 1, y supongo que lo de propagación de errores es de Occidente a Oriente en Denamrk (ok eso no fue una gran sorpresa :)). También se ha analizado este condicionalmente a diferentes situaciones meteorológicas con el fin de mostrar la relación entre la propagación y el viento (velocidad y dirección).

  • El segundo es ortogonal (en un sentido :)) a la primera. Para cada tiempo de $t$ dispone de un espacio-temporal (a lo largo del espacio y mirar hacia adelante veces) plannar modelo de onda con la constante de la velocidad de propagación. Esto le da a uno la velocidad de propagación por pronóstico del tiempo $t$ (e $R^2$ medición de la calidad del ajuste obtenido por el modelo de onda plana). A continuación, puede calcular las estadísticas sobre esas velocidades, eventualmente limitar a los casos en que el plano de la onda de ajuste es bueno. Resultados se observan en la Figura 2.

Figure 2

En el segundo caso, se observó que la media temporal de la velocidad de propagación tiene un similar magnitud como el que se obtiene con el promedio espacial en el primer caso. Si desea ver esta obra, más en serio, el papel está aquí.

1voto

jnewton Puntos 290

A mí me parece que usted tiene la cantidad suficiente de datos para el modelo de la dependencia en el espacio-tiempo y las condiciones meteorológicas influencias de la inclinación de los errores de pronóstico (es decir, la tendencia sistemática sobre/subestimar [primer momento]) y su varianza [segundo].

Para la exploración de la diagonal, yo acababa de hacer un montón de diagramas de dispersión, mapas de calor o hexbin parcelas. Para la exploración de la variabilidad, lo que me acababa de cuadrar el original de errores y, a continuación, volver a hacer un montón de diagramas de dispersión, mapas de calor o hexbin parcelas. Esto por supuesto no es totalmente libre de problemas si usted tiene un montón de prejuicios, pero puede ayudar a ver los patrones de la covariable de influencia heterocedasticidad.

Algunos de mis colegas hicieron un buen techreport que detalles muy flexible método para el montaje de este tipo de modelos (también permite la modelización de los momentos de orden superior, si es necesario) que también tiene un buen R-aplicación gamboostLSS basado en mboost: Mayr, Andreas; Fenske, Nora; Hofner, Benjamín; Kneib, Thomas y Schmid, Matthias (2010): GAMLSS para datos de alta dimensión – un enfoque flexible basado en impulsar.. Asumiendo que usted tiene acceso a las máquinas con una gran cantidad de memoria RAM (los conjuntos de datos parece ser GRANDE), se puede estimar todos los tipos de semiparamétrico efectos (como la superficie lisa de los estimadores de efectos espaciales o el efecto conjunto de la $t$$h$, producto tensor splines para la tempo-espacial de los efectos o suavizar las interacciones de los efectos meteorológicos, etc..) para los diferentes momentos y realice el término de la selección, al mismo tiempo, con el fin de obtener un parsimonioso e interpretables modelo. La esperanza sería que los términos de este modelo son suficientes para dar cuenta de la espacio-temporal de la estructura de autocorrelación de los errores de pronóstico, pero probablemente debería comprobar que los residuos de estos modelos para la autocorrelación (es decir vistazo a algunos de los variogramas y ACFs).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X