Como ha mencionado Ben, los métodos de los libros de texto para series temporales múltiples son los modelos VAR y VARIMA. En la práctica, sin embargo, no he visto que se utilicen tan a menudo en el contexto de la previsión de la demanda.
Mucho más común, incluyendo lo que mi equipo utiliza actualmente, es previsión jerárquica (véase aquí también ). La previsión jerárquica se utiliza siempre que tenemos grupos de series temporales similares: Historial de ventas de grupos de productos similares o relacionados, datos turísticos de ciudades agrupados por regiones geográficas, etc.
La idea es disponer de un listado jerárquico de los distintos productos y, a continuación, realizar previsiones tanto a nivel de base (es decir, para cada serie temporal individual) como a niveles agregados definidos por la jerarquía de productos (véase el gráfico adjunto). A continuación, concilie las previsiones en los distintos niveles (utilizando Top Down, Botton Up, Optimal Reconciliation, etc...) en función de los objetivos empresariales y los objetivos de previsión deseados. Tenga en cuenta que, en este caso, no ajustará un gran modelo multivariante, sino varios modelos en distintos nodos de la jerarquía, que se conciliarán utilizando el método de conciliación elegido.
La ventaja de este enfoque es que, al agrupar series temporales similares, se pueden aprovechar las correlaciones y similitudes entre ellas para encontrar patrones (como variaciones estacionales) que podrían ser difíciles de detectar con una sola serie temporal. Dado que generará un gran número de previsiones imposibles de ajustar manualmente, tendrá que automatizar su procedimiento de previsión de series temporales, pero eso no es demasiado difícil consulte aquí los detalles .
Amazon y Uber utilizan un enfoque más avanzado, pero de espíritu similar, en el que una gran red neuronal RNN/LSTM se entrena en todas las series temporales a la vez. Es similar en espíritu a la previsión jerárquica porque también intenta aprender patrones a partir de similitudes y correlaciones entre series temporales relacionadas. Se diferencia de la previsión jerárquica en que trata de aprender las relaciones entre las propias series temporales, en lugar de tener esta relación predeterminada y fija antes de realizar la previsión. En este caso, ya no hay que ocuparse de la generación automática de previsiones, puesto que sólo se sintoniza un modelo, pero como el modelo es muy complejo, el procedimiento de sintonización ya no es una simple tarea de minimización AIC/BIC, y hay que recurrir a procedimientos más avanzados de sintonización de hiperparámetros, como la optimización bayesiana.
Véase esta respuesta (y comentarios) para más detalles.
Para paquetes Python, PyAF está disponible pero no es muy popular. La mayoría de la gente utiliza el HTS en R, para el que existe mucho más apoyo por parte de la comunidad. Para los enfoques basados en LSTM, existen los modelos DeepAR y MQRNN de Amazon, que forman parte de un servicio por el que hay que pagar. Varias personas también han implementado LSTM para la previsión de la demanda utilizando Keras, puedes buscarlos.
5 votos
El paquete más avanzado para el análisis de series temporales de alta dimensión que conozco es
bigtime
en R. Quizás podrías llamar a R desde Python para poder usarlo.