1 votos

Predicción con VAR cuando una variable no tiene datos recientes

Tengo 10 variables para las que hago una previsión de un paso por delante utilizando un Modelo VAR . El modelo se entrenó con datos históricos de las variables. Casi todas las variables reciben nuevos puntos de datos diariamente, así que cada vez que llega un nuevo valor para cualquier variable hago una nueva previsión y de momento no utilizo predicciones como rezagos, sólo el valor más reciente para cada variable.

Los datos de una de las variables son bastante infrecuentes, por lo que en mi ecuación de predicción tendría datos bastante recientes para 9 variables (últimas 24 horas), y la 10ª variable tendrá el punto de datos más reciente de hace una semana o dos, que está bastante desfasado.

¿Qué opciones tengo? Yo estaba pensando en cualquiera de los dos:

  1. Utilizar el valor de predicción para la 10ª variable como entrada en el desfase para la siguiente predicción y para todas las demás variables utilizar los valores entrantes reales, ya que vienen con frecuencia. Tengo miedo aquí de errores crecientes ya que cada predicción tiene un error asociado. ¿Es válida mi preocupación?
  2. Utilice otro modelo multivariante para predecir sólo la 10ª variable teniendo las otras 9 variables como regresores. La clave aquí es que me gustaría utilizar los valores pasados de las 9 variables y no el valor pasado de la 10ª variable, ya que su valor pasado suele estar desfasado. ¿Qué modelo podría estar buscando aquí? Según tengo entendido, ARIMAX requiere no sólo los valores de los regresores, sino también el valor anterior del regresor, que es algo que quiero evitar, ya que el valor anterior no está actualizado.

Merci

1voto

¿Podría darnos más detalles sobre el modelo y los datos? ¿Es su VAR de orden 1? ¿Y por qué considera que los retardos de la 10ª variable son inútiles para predecir su valor más actual?

Sí, puede utilizar un modelo multivariante o univariante para predecir el valor de la 10ª variable no observada.

  1. Modelos univariantes: los típicos son ARIMA o HTA. Pero se construyen bajo el supuesto de que los datos anteriores sirven para pronosticar valores futuros, y tú dices que no es verdad. También se puede hacer que la previsión sea igual al último valor observable de la décima variable (este tipo de previsión se construye bajo el supuesto de raíz unitaria en las series y suele utilizarse como referencia para modelos más sofisticados).

  2. Modelos multivariantes:

    2.1 ARIMAX (ARIMA con regresores exógenos, utiliza retardos AR y MA, asume que las observaciones previas son útiles para predecir valores futuros).

    2.2 VAR (como usted ha considerado, y ya lo ha ajustado). La predicción basada en los valores reales de 9 variables y la predicción para la 10ª puede contener errores, pero puede comprobar en la muestra de prueba si este error es aceptable o no.

    2.3 Si las variables no son estacionarias y existe una relación lineal entre ellas (cointegración), puede ajustar el modelo VECM y utilizarlo para predecir la décima variable.

Si su tarea es producir la previsión más precisa, sólo tiene que comparar las diferentes opciones por sus errores en la muestra de prueba.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X