Basándome en el gráfico de descomposición STL, diría que la serie temporal sólo presenta una heteroscedasticidad muy leve (quizá un poco menos de varianza 2004-2008) y ésta no está asociada a períodos con un valor medio más alto o más bajo. Tampoco parece haber valores atípicos causados por un modelo aditivo, como una predicción negativa para un dato de recuento estrictamente no negativo. De hecho, la media parece variar sólo de 600 a 900 (<20% de rango relativo) y nunca se acerca a cero, por lo que la elección entre aditivo y multiplicativo probablemente no sea de importancia primordial. Así que yo recomendaría un modelo aditivo en este caso.
Para que quede clara la heurística que estoy utilizando para hacer esta recomendación, consideremos un contraejemplo. Supongamos que la media ha cambiado de 500 a 20.000 a lo largo de unos años, y que durante el período en que la media estaba cerca de 500, el error estándar era de unos 100, mientras que el error estándar durante el período en que la media era de 20.000 era de unos 4.000. Esto se mostraría en el componente residual del gráfico STL como una heteroscedasticidad muy fuerte.
Otro tipo de patología a buscar es la interacción de las predicciones estacionales y de tendencia. Consideremos estas dos afirmaciones sobre un sitio web que obtuvo 1 millón de páginas vistas al día de media durante un periodo de varios años
- En Navidad, el número de páginas vistas es 1/5 de lo normal.
- En Navidad, el número de páginas vistas es de 800.000
Ambos se ajustan a los datos históricos. ¿Pero qué pasa si el tráfico del sitio empieza a crecer y tenemos 2 millones en 2017 y 3 millones en 2018? ¿Seguiríamos utilizando un ajuste de -800e6 para ese día, o tendría más sentido el 1/5? ¿Y si el tráfico del sitio se reduce a sólo medio millón al día? ¿Predeciríamos entonces -300e6 páginas vistas negativas? Un modelo multiplicativo tomaría en cambio trend * seasonal
y predecir 500e6 * (1/5) = 100e6
para el mismo día. Por tanto, si utilizamos el modelo equivocado, veremos un enorme pico residual de una magnitud de 400e6 para ese día. Busque un componente estacional débil atípico en los residuos para indicar que hemos hecho una mala elección de multiplicativo frente a aditivo.
0 votos
¿Puedes publicar la descomposición STL en su lugar?
plot(stl(ts, 'periodic'))
en R, por ejemplo.0 votos
@olooney gyazo.com/4894ac6b6007145844735fec373a7a85