60 votos

¿Existe algún estándar de oro para la modelización de series temporales irregulares?

En el campo de la economía (creo) tenemos ARIMA y GARCH para series temporales regularmente espaciadas y Poisson, Hawkes para modelar procesos puntuales, así que ¿qué hay de los intentos de modelar series temporales irregularmente (desigualmente) espaciadas - hay (al menos) alguna práctica común?

(Si tienes algún conocimiento en este tema también puedes ampliar el correspondiente artículo wiki .)

Edición (sobre valores perdidos y series temporales irregulares) :

Respuesta al comentario de @Lucas Reis. Si las brechas entre las mediciones o realizaciones variable están espaciados debido a (por ejemplo) proceso de Poisson no hay mucho espacio para este tipo de regularización, pero existe procedimiento simple : t(i) es el índice de tiempo i-ésimo de la variable x (tiempo i-ésimo de la realización x), entonces se definen los espacios entre los tiempos de las mediciones como g(i)=t(i)-t(i-1) , entonces discretizamos g(i) utilizando la constante c , dg(i)=floor(g(i)/c y crear una nueva serie temporal con el número de valores en blanco entre las observaciones antiguas de la serie temporal original i y i+1 igual a dg(i), pero el problema es que este procedimiento puede producir fácilmente series temporales con un número de datos perdidos mucho mayor que el número de observaciones, por lo que la estimación razonable de los valores de las observaciones perdidas podría ser imposible y demasiado grande c eliminar la "estructura temporal/dependencia del tiempo, etc." del problema analizado (el caso extremo se da tomando c>=max(floor(g(i)/c)) que simplemente colapsan las series temporales espaciadas irregularmente en series espaciadas regularmente

Edición2 (sólo por diversión): Contabilización de imágenes para valores perdidos en series temporales irregulares o incluso caso de proceso puntual.

0 votos

Sólo para aclarar, cuando dice "espaciado irregular" no quiere decir "espaciado regular pero con valores perdidos", ¿verdad?

2 votos

No :) t(i) - tiempo, x[t(i)],x[t(i+1)],x[t(i+2)]... y t(j+1)-t(j) no es constante. Los datos se recogen de forma distribuida o asíncrona.

3 votos

33voto

Nathan Long Puntos 30303

Si las observaciones de un proceso estocástico están espaciadas irregularmente, la forma más natural de modelar las observaciones es como observaciones de tiempo discreto de un proceso de tiempo continuo.

Lo que generalmente se necesita de la especificación de un modelo es la distribución conjunta de las observaciones $X_{1}, \ldots, X_n$ observado a veces $t_1 < t_2 < \ldots < t_n$ y esto puede, por ejemplo, desglosarse en distribuciones condicionales de $X_{i}$ dado $X_{i-1}, \ldots, X_1$ . Si el proceso es un proceso de Markov, esta distribución condicional depende de $X_{i-1}$ $-$ no en $X_{i-2}, \ldots, X_1$ $-$ y depende de $t_i$ y $t_{i-1}$ . Si el proceso es homogéneo en el tiempo, la dependencia de los puntos de tiempo es sólo a través de su diferencia $t_i - t_{i-1}$ .

De ello se desprende que si tenemos observaciones equidistantes (con $t_i - t_{i-1} = 1$ , digamos) de un proceso de Markov homogéneo en el tiempo, sólo necesitamos especificar una única distribución de probabilidad condicional, $P^1$ para especificar un modelo. De lo contrario, tenemos que especificar toda una colección $P^{t_{i}-t_{i-1}}$ de distribuciones de probabilidad condicional indexadas por las diferencias temporales de las observaciones para especificar un modelo. De hecho, lo más fácil es especificar una familia $P^t$ de distribuciones de probabilidad condicional en tiempo continuo.

Una forma común de obtener la especificación de un modelo de tiempo continuo es a través de una ecuación diferencial estocástica (SDE) $$dX_t = a(X_t) dt + b(X_t) dB_t.$$ Un buen lugar para empezar a hacer estadísticas para los modelos SDE es Simulación e inferencia para ecuaciones diferenciales estocásticas por Stefano Iacus. Es posible que se describan muchos métodos y resultados para las observaciones equidistantes, pero esto suele ser sólo conveniente para la presentación y no esencial para la aplicación. Un obstáculo principal es que la especificación SDE rara vez permite una verosimilitud explícita cuando se tienen observaciones discretas, pero hay alternativas de ecuaciones de estimación bien desarrolladas.

Si se quiere ir más allá de los procesos de Markov, los modelos de volatilidad estocástica son como los modelos (G)ARCH que intentan modelar una varianza (volatilidad) heterogénea. También se pueden considerar ecuaciones de retardo como $$dX_t = \int_0^t a(s)(X_t-X_s) ds + \sigma dB_t$$ que son análogos en tiempo continuo de AR $(p)$ -procesos.

Creo que es justo decir que la práctica común cuando se trata de observaciones en puntos temporales irregulares es construir un modelo estocástico de tiempo continuo.

4 votos

GARCH no es un proceso de volatilidad estocástica. La vol en GARCH está completamente determinada para este periodo por las observaciones de los periodos anteriores.

16voto

csmba Puntos 114

Para las series temporales irregulares es fácil construir un Filtro Kalman .

Existe un documento sobre cómo transferir ARIMA a la forma de espacio de estados aquí

Y un documento que compara Kalman con GARCH aquí $^{(1)}$

$(1)$ Choudhry, Taufiq y Wu, Hao (2008)
Capacidad de previsión del método GARCH frente al método del filtro de Kalman: evidencia de la beta diaria variable en el tiempo del Reino Unido.
Revista de Previsión , 27, (8), 670-689. (doi:10.1002/for.1096).

0 votos

Lo siento, no tengo acceso a ese último documento, ¿podría ayudarme?

2 votos

He añadido la cita para que sea fácil de encontrar - también hay un preprint aquí: eprints.soton.ac.uk/147383

1 votos

El documento sobre la transferencia de ARIMA al espacio de estados parece tener un enlace roto.

11voto

Ivana Puntos 97

Cuando buscaba una forma de medir la cantidad de fluctuación en datos muestreados de forma irregular me encontré con estos dos artículos sobre el suavizado exponencial para datos irregulares de Cipra [ 1 , 2 ]. Estos se basan en las técnicas de suavización de Brown, Winters y Holt (véase la entrada de Wikipedia para Suavizado exponencial ), y en otro método de Wright (véanse las referencias en el documento). Estos métodos no suponen mucho sobre el proceso subyacente y también funcionan para datos que muestran fluctuaciones estacionales.

No sé si algo de esto cuenta como un "estándar de oro". Para mi propio propósito, decidí utilizar el suavizado exponencial de dos vías (simple) siguiendo el método de Brown. La idea del alisamiento bidireccional la obtuve leyendo el resumen de un trabajo de un estudiante (que ahora no puedo encontrar).

9voto

B. VB. Puntos 116

El análisis de series temporales de muestreo irregular puede ser complicado, ya que no hay muchas herramientas disponibles. A veces, la práctica consiste en aplicar algoritmos regulares y esperar lo mejor. Este no es necesariamente el mejor enfoque. Otras veces se intenta interpolar los datos en los huecos. Incluso he visto casos en los que los huecos se rellenan con números aleatorios que tienen la misma distribución que los datos conocidos. Un algoritmo específico para series de muestreo irregular es el Periodograma de Lomb-Scargle, que proporciona un periodograma (piense en el espectro de potencia) para series de tiempo de muestreo irregular. Lomb-Scargle no requiere ningún "acondicionamiento de la brecha".

3voto

Shawn Miller Puntos 3875

¿Qué acerca de los primeros modelado de los tiempos de los puntos y, a continuación, los valores de los puntos, condicional en sus tiempos. Yo creo que 'punto marcado de los procesos son el término.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X