Además de los otros comentarios útiles publicados aquí...
En un sentido más amplio... los datos diarios suelen estar impulsados por factores exógenos... como el día de la semana, el día del mes, la semana del mes, el mes del año, la actividad antes y después de los días festivos importantes, los efectos del fin de semana largo en torno a los días festivos, los cambios de nivel / las tendencias horarias locales y, a menudo, los cambios en los efectos del día de la semana que se pasan por alto.
Para identificar los factores mencionados anteriormente hay que detectar los efectos puntuales inusuales que hay que incluir para poder identificar más claramente. Los valores atípicos no tratados ofuscan la estructura estadística.
Además de todo esto, es necesario incorporar cualquier estructura arima que refleje series de entrada estocásticas omitidas/no especificadas, como el tiempo de hoy, el tiempo de ayer y el tiempo previsto para el día siguiente. La estructura arima debe utilizarse como último recurso, ya que parte de la premisa ingenua de que el pasado es la causa/razón del futuro como si condujera por la carretera utilizando la ventanilla trasera para guiarse, imponiendo así la endogeneidad en lugar de la exogeneidad (serie causal).
Las variables causales conocidas o adivinadas, como el precio, el clima o el número de habitantes, también son fundamentales, ya que su inclusión suele desenmascarar o aclarar otras dependencias significativas.
Con sólo un año de datos, será difícil distinguir las anomalías de los efectos reales.
Se inicia este proceso buscando el efecto paraguas de los días festivos e identificando simultáneamente los cambios de nivel y/o las tendencias horarias locales al tiempo que se incorporan las variables del día de la semana. A continuación, se vuelve a examinar de forma iterativa los residuos del modelo para sugerir un aumento del mismo (step-forward), al tiempo que se excluyen los factores que no son significativos (step-down ).
Personalmente, he utilizado este enfoque para varias series similares a la suya con gran éxito.
Para ver la lista de análisis/reflexiones de datos diarios, eche un vistazo a https://stats.stackexchange.com/search?q=user%3A3382+diario
1 votos
Es necesario añadir la hora del día, el día de la semana, los días festivos, el mes del año y otras variables pertinentes, ya que todas ellas han demostrado ser eficaces para predecir las visitas a los servicios de urgencias. Puede generar la mayoría de las variables automáticamente. También puede añadir información relacionada con el tiempo si la tiene.
0 votos
@forecaster He trabajado con datos horarios del transporte de París por días y he comprobado que los patrones horarios suelen depender del día de la semana, etc. Un verdadero reto para el software ( y los humanos ) para resolver esto.
0 votos
Finalmente utilicé un modelo GAM como el expuesto en stats.stackexchange.com/questions/173/ . Gracias a todos.