10 votos

Crecimiento intermensual desestacionalizado con estacionalidad semanal subyacente

Como pasatiempo adicional, he estado explorando la previsión de series temporales (en particular, utilizando R).

Para mis datos, tengo el número de visitas por día, para cada día que se remonta a casi 4 años. En estos datos hay algunos patrones distintos:

  1. De lunes a viernes hay muchas visitas (las más altas son las de lunes y martes), pero las de sábado y domingo son mucho menos.
  2. Ciertas épocas del año descienden (por ejemplo, muchas menos visitas en torno a los días festivos de EE.UU., los veranos muestran un menor crecimiento)
  3. Importante crecimiento interanual

Estaría bien poder hacer una previsión para el año que viene con estos datos, y también utilizarlos para tener un crecimiento desestacionalizado mes a mes. Lo principal que me echa para atrás con una vista mensual es:

  • Ciertos meses tendrán más lunes/martes que otros (y eso tampoco es constante a lo largo de los años). Por lo tanto, un mes que tenga más días entre semana debe ajustarse en consecuencia.

La exploración de las semanas también parece difícil ya que los sistemas de numeración de las semanas cambian de 52 a 53 dependiendo del año, y parece ts no maneja eso.

Estoy pensando en sacar una media de los días de la semana del mes, pero la unidad resultante es un poco extraña (Crecimiento de las visitas medias en días de la semana) y eso sería descartar datos que son válidos.

Creo que este tipo de datos sería común en las series temporales, (digamos por ejemplo el uso de la electricidad en un edificio de oficinas podría ser algo así), ¿alguien tiene algún consejo sobre cómo modelarlo, en particular, en R?

Los datos con los que estoy trabajando son bastante sencillos, empiezan así:

            [,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467

y continúa así hasta el presente, con una tendencia general de crecimiento, algunos descensos en torno a las semanas de vacaciones en EE.UU., y un crecimiento generalmente más lento durante el verano.

0 votos

Otro aspecto interesante de los datos es que hay eventos repentinos que interrumpen la tendencia general de crecimiento por un período de ~ un par de meses. Sin embargo, en este momento, en el que estoy tratando de establecer adecuadamente la estacionalidad, estoy ignorando ese aspecto.

0 votos

Además, corrígeme si no estoy utilizando correctamente la "estacionalidad". En este momento estoy pensando en un patrón dentro de la unidad de tiempo que digo. Así que "estacionalidad semanal" para mí significa "un patrón que se repite cada semana".

0 votos

Hmm, me suena (-;

5voto

Owen Fraser-Green Puntos 642

Modelizo este tipo de datos todo el tiempo. Es necesario incorporar

  • día de la semana
  • Efectos de las vacaciones (efectos principales, contemporáneos y retardados)
  • días especiales del mes
  • quizás el viernes antes de un día festivo o el lunes después de un día festivo
  • efectos semanales
  • efectos mensuales
  • Estructura ARIMA para convertir los errores en ruido blanco;
  • et.al. .

El enfoque estadístico se denomina Modelización de la Función de Transferencia con DEtección de la Intervención. Si quieres compartir tus datos, ya sea en privado a través de dave@autobox.com o, preferiblemente, a través de SE , estaría más que encantado de mostrarte los detalles de un modelo final y fomentar tu capacidad para hacerlo por ti mismo o, al menos, para ayudarte a ti y a otros a entender lo que hay que hacer y lo que se puede hacer. En cualquiera de los casos, usted saldrá más inteligente sin gastar ningún tesoro, ya sea en monedas o en tiempo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X