4 votos

Series temporales de datos de recuento de llegadas a urgencias hospitalarias

Recientemente he empezado a trabajar en un hospital y estamos interesados en prever las llegadas a urgencias; la única variable de la que disponemos es el número de llegadas a urgencias

La serie temporal tiene el siguiente aspecto enter image description here

Y el acf y el pacf se ven así enter image description here

enter image description here

He tenido problemas para ajustar un modelo de serie temporal a estos datos, he probado un modelo ARMA con un componente autorregresivo de orden 7 y un componente de media móvil del mismo orden también; No obstante, las series temporales parecen bastante aleatorias y, según el gráfico de autocorrelación y el gráfico de autocorrelación parcial, la autocorrelación parece muy baja, por lo que, en mi opinión, no tiene sentido ajustar un modelo de este tipo (corrígeme si me equivoco); intenté ajustar un modelo autorregresivo de Poisson, pero los resultados fueron bastante similares, y el pronóstico fue bastante pobre. A estas alturas estoy un poco perdido y no conozco ninguna otra idea para conseguir un buen ajuste y una buena previsión para estos datos, sería de gran ayuda un consejo sobre cómo enfocar este problema. Gracias de antemano.

1 votos

Es necesario añadir la hora del día, el día de la semana, los días festivos, el mes del año y otras variables pertinentes, ya que todas ellas han demostrado ser eficaces para predecir las visitas a los servicios de urgencias. Puede generar la mayoría de las variables automáticamente. También puede añadir información relacionada con el tiempo si la tiene.

0 votos

@forecaster He trabajado con datos horarios del transporte de París por días y he comprobado que los patrones horarios suelen depender del día de la semana, etc. Un verdadero reto para el software ( y los humanos ) para resolver esto.

0 votos

Finalmente utilicé un modelo GAM como el expuesto en stats.stackexchange.com/questions/173/ . Gracias a todos.

3voto

icelava Puntos 548

No lo dices, pero supongo que tus datos son diarios. Y que sólo tienes datos de un año.

Sus gráficos ACF/PACF muestran picos en los lapsos 7, 14, etc. Se trata de una estacionalidad semanal, que tiene sentido para los ingresos de urgencia. Por lo tanto, debe decirle a R que tiene una serie temporal estacional con el período 7, ts(..., frequency=7) . Entonces auto.arima() debería captar su estacionalidad y ofrecerle un modelo ARIMA estacional. Este debería ser el punto de referencia para evaluar modelos más complejos.

Una referencia simple alternativa sería una previsión "ingenua estacional": para el próximo domingo, prever la observación del domingo pasado, y así sucesivamente. Los puntos de referencia simples pueden ser muy difíciles de superar.

Si tiene más de un año de datos, puede intentar incluir también la estacionalidad anual utilizando modelos que puedan tratar con multiplicidad de estacionalidades Por ejemplo, murciélagos o tbats .

Además, pensar en cualquier conductor fuerte . ¿Qué hace que la gente acuda a su servicio de urgencias? ¿Es el tiempo? (Esto puede ser más importante en algunas partes del mundo que en otras.) ¿Se trata de días especiales, como la gente que se hace daño con los fuegos artificiales en EE.UU. el 4 de julio o en otros lugares en la víspera de Año Nuevo (esto podría estar cubierto por la estacionalidad anual)? ¿Ha habido algún cambio en la normativa que haya inducido un cambio de paso en algún lugar? Utilice un enfoque de regresión para incluir esos factores, y luego modele los residuos utilizando algoritmos de series temporales como los anteriores.

Tenemos una serie de preguntas sobre el día a día previsión Así que navegar a través de ellos podría ser útil .

0voto

Owen Fraser-Green Puntos 642

Además de los otros comentarios útiles publicados aquí...

En un sentido más amplio... los datos diarios suelen estar impulsados por factores exógenos... como el día de la semana, el día del mes, la semana del mes, el mes del año, la actividad antes y después de los días festivos importantes, los efectos del fin de semana largo en torno a los días festivos, los cambios de nivel / las tendencias horarias locales y, a menudo, los cambios en los efectos del día de la semana que se pasan por alto.

Para identificar los factores mencionados anteriormente hay que detectar los efectos puntuales inusuales que hay que incluir para poder identificar más claramente. Los valores atípicos no tratados ofuscan la estructura estadística.

Además de todo esto, es necesario incorporar cualquier estructura arima que refleje series de entrada estocásticas omitidas/no especificadas, como el tiempo de hoy, el tiempo de ayer y el tiempo previsto para el día siguiente. La estructura arima debe utilizarse como último recurso, ya que parte de la premisa ingenua de que el pasado es la causa/razón del futuro como si condujera por la carretera utilizando la ventanilla trasera para guiarse, imponiendo así la endogeneidad en lugar de la exogeneidad (serie causal).

Las variables causales conocidas o adivinadas, como el precio, el clima o el número de habitantes, también son fundamentales, ya que su inclusión suele desenmascarar o aclarar otras dependencias significativas.

Con sólo un año de datos, será difícil distinguir las anomalías de los efectos reales.

Se inicia este proceso buscando el efecto paraguas de los días festivos e identificando simultáneamente los cambios de nivel y/o las tendencias horarias locales al tiempo que se incorporan las variables del día de la semana. A continuación, se vuelve a examinar de forma iterativa los residuos del modelo para sugerir un aumento del mismo (step-forward), al tiempo que se excluyen los factores que no son significativos (step-down ).

Personalmente, he utilizado este enfoque para varias series similares a la suya con gran éxito.

Para ver la lista de análisis/reflexiones de datos diarios, eche un vistazo a https://stats.stackexchange.com/search?q=user%3A3382+diario

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X