2 votos

Regresión múltiple - Modelización de datos semanales

Estoy analizando los datos de ventas semanales de un producto que es muy estacional. Me gustaría capturar la estacionalidad en el modelo de regresión. He leído que si se tienen datos trimestrales o mensuales, en ese caso se pueden crear 3 y 11 variables ficticias respectivamente - pero ¿puedo tratar con datos semanales?

Tengo casi 3 años de datos semanales. Las variables independientes son el precio medio, la inversión publicitaria, las promociones, un par de índices de la competencia, las vacaciones escolares (1/0), la temperatura y otras. La variable dependiente son las ventas de ese producto. No busco un modelo de series temporales ya que estoy utilizando un modelo de regresión múltiple y estoy tratando de entender la influencia de las variables independientes y no hacer ninguna previsión.

¡Gracias! :)

1voto

Owen Fraser-Green Puntos 642

Puede utilizar 51 maniquíes para representar los efectos semanales. Hay que tener cuidado con una o más tendencias, uno o más cambios de nivel, uno o más valores atípicos de pulso Y/O cualquier autocorrelación significativa en los residuos, ya que cualquiera de ellos viciará cualquiera de sus resultados. También puede haber un cambio en los efectos semanales, por ejemplo, el efecto de la semana 1 en el año 1 es de -20, mientras que el efecto de la semana 1 en los años 2 y 3 es de +10. Un análisis incorrecto sugerirá que no hay efecto de la semana 1. Los enfoques simples a veces funcionan cuando los datos son simples. En general, los enfoques sencillos deberían probarse simplemente para detectar posibles infracciones utilizando programas/procedimientos agresivos. Si quieres ver un enfoque posiblemente más correcto/riguroso para tus datos (destacando las implicaciones de la inframodificación) por qué no lo publicas.

Por cierto, los modelos de series temporales son un superconjunto de los modelos de regresión, ya que pueden incluir variables regresoras del tipo que usted haya especificado, es decir, fijas/deterministas (e incluso tipos más potentes que permiten estructuras de adelanto y retraso). Cuando se utiliza el término modelo de series temporales, simplemente se hace referencia a los modelos ARIMA puros. La referencia más correcta/general a los modelos de series temporales incluye variables causales, pero todo depende de quiénes hayan sido sus profesores o de qué libro de texto hayan utilizado

0voto

B.Frost Puntos 21

Como ya se ha mencionado, se pueden crear 51 variables ficticias para representar las semanas, pero yo sugeriría probar el rendimiento de ese modelo (utilizando el RMSE u otro) frente a un modelo más sencillo que utilice un predictor mensual en su lugar. Si la estacionalidad es el predictor más potente, entonces los indicadores semanales pueden merecer la complejidad añadida, pero si su objetivo es la interpretabilidad, los indicadores mensuales pueden ser mucho más sencillos de explicar/comunicar, especialmente si el poder predictivo es similar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X