Estoy trabajando en un proyecto de previsión. Tengo el recuento de la orden de compra para un periodo de tiempo de 18 meses. Estoy intentando crear una previsión a partir de datos de series temporales que tienen observaciones sólo en días laborables. El objetivo es producir un pronóstico que refleje estos datos/predice datos futuros similares, teniendo resultados de pronóstico razonables para los días de semana y un valor de 0 en los fines de semana o sin puntos de datos en los fines de semana.
-
¿Es posible hacer una previsión con datos diarios para un periodo inferior a 2 años (18 meses) que sea totalmente aleatorio (picos inusuales)?
-
cuál será la frecuencia preferida
mirando los datos de la parcela ya es estacionaria.
adf.test(LinesTS)
Augmented Dickey-Fuller Test
data: LinesTS
Dickey-Fuller = -5.0479, Lag order = 7, p-value = 0.01
alternative hypothesis: stationary
Warning message:
In adf.test(LinesTS) : p-value smaller than printed p-value
#plot acf and pacf
acf(LinesTS)
pacf(LinesTS)
Mirando el ACF y el PACF, soy incapaz de decidir el valor de p y q
Model1<-auto.arima(LinesTS)
Pred<-forecast(Model1, h=10)
plot(Pred)
summary(Pred)
Método de previsión: ARIMA(1,1,3)
Model Information:
Series: LinesTS
ARIMA(1,1,3)
Coefficients:
ar1 ma1 ma2 ma3
0.8764 -1.6233 0.5043 0.1228
s.e. 0.0898 0.1039 0.1161 0.0612
sigma^2 estimated as 117337: log likelihood=-2698.16
AIC=5406.32 AICc=5406.48 BIC=5425.91
Error measures:
ME RMSE MAE MPE MAPE MASE ACF1
Training set 13.63978 340.2409 246.075 -59.91909 84.11576 0.7965949 -0.006130562
Forecasts:
Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
374 676.3382 237.3498 1115.327 4.963338 1347.713
375 712.3409 259.5113 1165.170 19.797740 1404.884
376 713.7888 258.7170 1168.861 17.816554 1409.761
377 715.0578 258.1237 1171.992 16.237339 1413.878
378 716.1700 257.6759 1174.664 14.963754 1417.376
379 717.1446 257.3326 1176.957 13.922828 1420.366
380 717.9988 257.0635 1178.934 13.059163 1422.938
381 718.7474 256.8463 1180.649 12.330632 1425.164
382 719.4035 256.6644 1182.143 11.705155 1427.102
383 719.9784 256.5059 1183.451 11.158283 1428.799
No estoy logrando los resultados que esperaba, los valores de error son muy altos cómo reducir los errores estimados. y obtener los mejores valores de previsión.
¿Estoy haciendo algo mal en este caso, porque mis valores previstos son muy diferentes de los valores reales?
¿alguien puede guiarme sobre cómo manejar los datos de los días hábiles para menos de 2 años del período de tiempo? ¿Puede alguien mirar el marco de datos adjunto y sugerir el mejor método posible para pronosticar? https://drive.google.com/open?id=1Av7usiPxBkfwAYQXVcqKcBlGUeV8wcRt