Tengo 10 variables para las que hago una previsión de un paso por delante utilizando un Modelo VAR . El modelo se entrenó con datos históricos de las variables. Casi todas las variables reciben nuevos puntos de datos diariamente, así que cada vez que llega un nuevo valor para cualquier variable hago una nueva previsión y de momento no utilizo predicciones como rezagos, sólo el valor más reciente para cada variable.
Los datos de una de las variables son bastante infrecuentes, por lo que en mi ecuación de predicción tendría datos bastante recientes para 9 variables (últimas 24 horas), y la 10ª variable tendrá el punto de datos más reciente de hace una semana o dos, que está bastante desfasado.
¿Qué opciones tengo? Yo estaba pensando en cualquiera de los dos:
- Utilizar el valor de predicción para la 10ª variable como entrada en el desfase para la siguiente predicción y para todas las demás variables utilizar los valores entrantes reales, ya que vienen con frecuencia. Tengo miedo aquí de errores crecientes ya que cada predicción tiene un error asociado. ¿Es válida mi preocupación?
- Utilice otro modelo multivariante para predecir sólo la 10ª variable teniendo las otras 9 variables como regresores. La clave aquí es que me gustaría utilizar los valores pasados de las 9 variables y no el valor pasado de la 10ª variable, ya que su valor pasado suele estar desfasado. ¿Qué modelo podría estar buscando aquí? Según tengo entendido, ARIMAX requiere no sólo los valores de los regresores, sino también el valor anterior del regresor, que es algo que quiero evitar, ya que el valor anterior no está actualizado.
Merci