1 votos

previsión de series temporales en R para un periodo inferior a 2 años (18 meses) que es totalmente aleatorio

Estoy trabajando en un proyecto de previsión. Tengo el recuento de la orden de compra para un periodo de tiempo de 18 meses. Estoy intentando crear una previsión a partir de datos de series temporales que tienen observaciones sólo en días laborables. El objetivo es producir un pronóstico que refleje estos datos/predice datos futuros similares, teniendo resultados de pronóstico razonables para los días de semana y un valor de 0 en los fines de semana o sin puntos de datos en los fines de semana.

  1. ¿Es posible hacer una previsión con datos diarios para un periodo inferior a 2 años (18 meses) que sea totalmente aleatorio (picos inusuales)?

  2. cuál será la frecuencia preferida

enter image description here

mirando los datos de la parcela ya es estacionaria.

adf.test(LinesTS)

    Augmented Dickey-Fuller Test

data:  LinesTS
Dickey-Fuller = -5.0479, Lag order = 7, p-value = 0.01
alternative hypothesis: stationary

Warning message:
In adf.test(LinesTS) : p-value smaller than printed p-value

#plot acf and pacf
acf(LinesTS)
pacf(LinesTS)

enter image description here enter image description here

Mirando el ACF y el PACF, soy incapaz de decidir el valor de p y q

Model1<-auto.arima(LinesTS)
Pred<-forecast(Model1, h=10)
plot(Pred)
summary(Pred)

Método de previsión: ARIMA(1,1,3)

Model Information:
Series: LinesTS 
ARIMA(1,1,3) 

Coefficients:
         ar1      ma1     ma2     ma3
      0.8764  -1.6233  0.5043  0.1228
s.e.  0.0898   0.1039  0.1161  0.0612

sigma^2 estimated as 117337:  log likelihood=-2698.16
AIC=5406.32   AICc=5406.48   BIC=5425.91

Error measures:
                   ME     RMSE     MAE       MPE     MAPE      MASE         ACF1
Training set 13.63978 340.2409 246.075 -59.91909 84.11576 0.7965949 -0.006130562

Forecasts:
    Point Forecast    Lo 80    Hi 80     Lo 95    Hi 95
374       676.3382 237.3498 1115.327  4.963338 1347.713
375       712.3409 259.5113 1165.170 19.797740 1404.884
376       713.7888 258.7170 1168.861 17.816554 1409.761
377       715.0578 258.1237 1171.992 16.237339 1413.878
378       716.1700 257.6759 1174.664 14.963754 1417.376
379       717.1446 257.3326 1176.957 13.922828 1420.366
380       717.9988 257.0635 1178.934 13.059163 1422.938
381       718.7474 256.8463 1180.649 12.330632 1425.164
382       719.4035 256.6644 1182.143 11.705155 1427.102
383       719.9784 256.5059 1183.451 11.158283 1428.799

No estoy logrando los resultados que esperaba, los valores de error son muy altos cómo reducir los errores estimados. y obtener los mejores valores de previsión.

¿Estoy haciendo algo mal en este caso, porque mis valores previstos son muy diferentes de los valores reales?

¿alguien puede guiarme sobre cómo manejar los datos de los días hábiles para menos de 2 años del período de tiempo? ¿Puede alguien mirar el marco de datos adjunto y sugerir el mejor método posible para pronosticar? https://drive.google.com/open?id=1Av7usiPxBkfwAYQXVcqKcBlGUeV8wcRt

3voto

icelava Puntos 548
  1. Ciertamente, es posible predecir datos totalmente aleatorios.
  2. El mejor método dependerá de lo que signifique "totalmente aleatorio" y de lo que signifique "mejor". Supongamos que "mejor" significa "la menor expectativa". mse ".

    • Si "totalmente aleatorio" significa ventas independientes e idénticamente distribuidas (iid), entonces la mejor previsión será la media histórica.
    • Si "totalmente al azar" significa iid incrementos sobre las ventas del día anterior, es decir, un paseo aleatorio, entonces la mejor previsión será la última observación, también conocida como "previsión ingenua". Este proceso de generación de datos es poco plausible para las ventas, aunque es una buena primera idea para los precios de las acciones.

"Mejor" = "más bajo esperado mapear " tiene una respuesta diferente . "Mejor" = "el más bajo esperado mae " puede tener otra respuesta .

Sospecho que usted tiene algo diferente en mente por "totalmente al azar". Tenemos una serie de hilos sobre la previsión de datos diarios. Navegar por ellas debería ser útil.

No estoy logrando los resultados que esperaba, los valores de error son muy altos cómo reducir los errores estimados. y obtener los mejores valores de previsión.

Esto puede ser útil.

¿Estoy haciendo algo mal en este caso, porque mis valores previstos son muy diferentes de los valores reales?

Cualquier serie temporal se compone tanto de señal como de ruido. Un método de previsión intentará aislar y prever la señal, e ignorar el ruido, porque el ruido, por definición, no se puede prever. Por lo tanto, la previsión siempre será menos variable que el historial.

¿alguien puede guiarme sobre cómo manejar los datos de los días hábiles para menos de 2 años del período de tiempo? ¿Puede alguien mirar el marco de datos adjunto y sugerir el mejor método posible para pronosticar?

Puede especificar que sus datos pueden tener estacionalidad semanal utilizando ts(...,frequency=7) . Entonces auto.arima() puede dar un modelo estacional si la estacionalidad semanal es lo suficientemente fuerte. Si puede obtener más datos, es posible que pueda ajustar un modelo con multiestacionalidades .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X