14 votos

Modelo de series de tiempo de ensamble

Necesito automatizar tiempo-pronóstico de serie, y no sé de antemano las características de esas series (estacionalidad, tendencia, ruido, etc).

Mi objetivo no es conseguir el mejor modelo posible para cada serie, pero para evitar bastante malo modelos. En otras palabras, para conseguir que los pequeños errores cada vez que no es un problema, pero para conseguir grandes errores de vez en cuando.

Pensé que podría lograr esto mediante la combinación de modelos calculados con diferentes técnicas.

Es decir, aunque ARIMA sería el mejor enfoque para una serie específica, puede no ser la mejor para la otra serie, el mismo que para el suavizado exponencial.

Sin embargo, si puedo combinar un modelo de cada técnica, incluso si un modelo no es tan bueno, el otro va a traer la estimación más cercana al valor real.

Es bien sabido que ARIMA funciona mejor para el largo plazo, con buen comportamiento de la serie, mientras que el suavizado exponencial se destaca a corto plazo ruidoso de la serie.

  • Mi idea es combinar los modelos generados a partir de ambas técnicas con el fin de obtener más robusto de los pronósticos, ¿tiene sentido?

Puede haber muchas formas de combinar los modelos.

  • Si este es un buen enfoque, ¿cómo debo combinarlos?

Un promedio simple de los pronósticos es una opción, pero tal vez podría obtener mejores predicciones si yo peso de la media de acuerdo a alguna medida de la bondad del modelo.

  • ¿Cuál sería el tratamiento de la varianza de la combinación de los modelos?

16voto

icelava Puntos 548

La combinación de pronósticos es una excelente idea. (Creo que no es una exageración decir que esta es una de las pocas cosas académico de los meteorólogos están de acuerdo.)

Sucede que tengo escrito en un papel un tiempo buscando diferentes maneras de peso pronósticos en la combinación de ellos: http://www.sciencedirect.com/science/article/pii/S0169207010001032 Básicamente, el uso de (Akaike) pesos no siempre mejorar combinaciones más simples o recortado/winsorized medios o medianas, así que yo personalmente se lo pensaría dos veces antes de la implementación de un procedimiento complejo que no se puede producir una ventaja clara (recordemos, sin embargo, que las combinaciones superó sistemáticamente selección única de los métodos mediante los criterios de información). Esto puede depender de la particular de series de tiempo que usted tiene, por supuesto.

Miré a la combinación de intervalos de predicción en el documento anterior, pero no en la combinación de la varianza como tal. Me parece recordar un papel no hace mucho en el IJF con este enfoque, así que puede que desee de la búsqueda para "combinar" o "combinación" a través de los números de la IJF.

Algunos otros trabajos que han analizado la combinación de pronósticos están aquí (a partir de 1989, pero una revisión) y aquí y aquí (también se ve en densidades) y aquí y aquí. Muchos de estos tenga en cuenta que todavía es mal entendido por qué la previsión de combinaciones con frecuencia superan a solo modelos seleccionados. La segunda hasta la última nota es en el M3 de previsión de la competencia; una de sus principales conclusiones fue (número de (3) en la p. 458) que "la precisión de La combinación de varios métodos supera, en promedio, los métodos específicos que se combinan y hace bien en comparación con otros métodos." El último de estos trabajos se encuentra que las combinaciones no necesariamente se desempeñan mejor que los modelos sencillos, pero que pueden reducir considerablemente el riesgo de un fallo catastrófico (que es uno de sus objetivos). La literatura más fácilmente debe encontrarse en la Revista Internacional de la Previsión, el Diario de Previsión y para aplicaciones más específicas en la econometría o la cadena de suministro de la literatura.

1voto

auselen Puntos 121

¿Por qué no especificar más? No creo que un modelo que podría producir que podría ser mejor o lo suficientemente bueno de una elección concreta.

Con eso dicho, si usted puede reducir sus opciones un poco a los que usted puede probar y los datos de entrada pueden ser estandarizados, entonces ¿por qué no escribir un fichero automatizado de procedimiento de la prueba en R?

Digamos que usted decide que sus datos se encuentran dentro de un rango que se estima por cinco modelos, así como una "reserva". A decir que usted puede caracterizar la entrada por diferentes pruebas. A continuación, sólo seguir adelante y escribir un R (o un programa como ese) el algoritmo que se ejecuta este para usted. Esto funciona si usted puede producir un diagrama de flujo del modelo de ejecución basado en los datos de prueba, que es que si cualquier punto del árbol de decisión es binario.

Si esto no es una opción, porque la decisión no puede ser binario, sugiero implementar un sistema de calificación basado en las pruebas y ejecutar algunos "casos extremos" datos simulados a través de la cuadrícula para ver si los resultados son lo que usted está buscando.

Puede combinar estas cosas obviamente, por ejemplo la prueba de la no-estacionariedad puede dar un definitivo sí-no, mientras que otros atributos que pueden caer dentro de un rango, tales como la multicolinealidad.
Usted puede dibujar esta en el papel, en primer lugar, a continuación, construir, simular con el conocido distribuciones que esperar a tener.

A continuación, sólo tiene que ejecutar el programa R cada vez que los nuevos que llegan los datos. No veo la necesidad de combinar varios modelos con capacidades computacionales lo más probable es que tengan a mano.

0voto

Es una agradable y fórmulas simples para la combinación de dos métodos de predicción, que el peso de ellos multipling el primero por una y el otro por (1 - a), donde a es encontrado por la minimización de la varianza de esta combinación de previsión. Como usted sabe los errores de ambos métodos de predicción, se pueden calcular los errores de la combinación que dependerá de "un". El cálculo es simple, cuando la media de cada método es = 0. Para la combinación de más de 2 métodos de las fórmulas es todavía "simple" en el sentido de que se puede calcular analíticamente "a mano", o también usar la opción Solver de EXCEL

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X