22 votos

La captura de la estacionalidad en la regresión múltiple para datos diarios

Tengo un diario de los datos de ventas para un producto que es altamente estacional. Quiero capturar la estacionalidad en el modelo de regresión. He leído que si tienes trimestral o mensual de datos, en el caso de que usted puede crear 3 y 11 variables ficticias, respectivamente—, pero puedo tratar de lidiar con datos diarios?

Tengo tres años de datos diarios. Las variables independientes son el precio de punto, de promoción de la bandera (sí/no), y de la temperatura. La variable dependiente es la venta de ese producto. Yo no estoy en busca de un modelo de serie temporal como estoy usando un modelo de regresión múltiple.

17voto

forecaster Puntos 3015

@Irishstat cubierto prácticamente lo que iba a decir, pero me gustaría responder con mi propia experiencia personal en el modelado de estos datos con series de tiempo y regresión de MCO de la regresión.

Si es una tarifa diaria de datos, a continuación, me gustaría hacer lo siguiente:

Crear una variable ficticia para los diferentes estacionalidad:

  • Para capturar día de la semana de la estacionalidad, crear 6 variables ficticias.
  • Para capturar día del mes de la estacionalidad, crear 30 variables ficticias
  • Para la captura de los meses del año, crear 11 variables ficticias.

Crear variable ficticia para variables de tendencia:

  • Si la serie de tiempo de las exhibiciones de tendencia lineal, a continuación, agregar una tendencia del tiempo variable.

  • Si la serie de tiempo exhibe tendencia no lineal, agregar un tiempo no lineal tendencia de variables tales como la cuadrática/cúbico/log

Agregar variables Independientes Variables

  • Esta es una serie de tiempo de datos, por lo que debe tener cuidado acerca de plomo y gal efectos de independiente varibales. Por ejemplo, en tu ejemplo, usted menciona a precio promocional bandera, no podría haber efecto inmediato en su respuesta, es decir, no puede ser retrasada y una descomposición/permanente efecto. Así, por ejemplo, si ejecuta una promoción hoy en día, usted puede tener un aumento en las ventas hoy en día, pero el efecto de la promoción se desintegra después de unos pocos días. No hay ninguna manera fácil para este modelo mediante regresión múltiple, puede que desee utilizar la función de transferencia modelado que es parsimonoius y puede manejar cualquier tipo de plomo y gal efectos. Ver este ejemplo he publicado anteriormente, donde hay una intervención(en el caso de punto de precio) y hay un abrupto aumento, seguido por una descomposición efecto. Después de haber dicho que si usted tiene a priori el conocimiento sobre el plomo y el lag efecto, crear variables adicionales en su caso las variables ficticias antes y después del punto de precio y (sí/no) la promoción del cambio.

  • También habría que agregar movimiento Vacaciones indicador variables, por ejemplo, como Irishstat señaló que desee agregar/Pascua día de acción de gracias (en estados unidos) que se están moviendo los días Festivos. Los días festivos que están fijadas las fechas serán automáticamente cuidado de si usted está utilizando el maniquí esquema de codificación para captura de estacionalidad.

  • Además, sería necesario para identificar valores atípicos tales como aditivo/pulso (una sola vez) o de cambio de nivel (cambio permanente) y agregarlos como regresores. La identificación de valores atípicos en varios de regresión para datos de series de tiempo es casi imposible; necesitaría tiempo de la serie de valores atípicos en los métodos de detección, tales como Tsay del procedimiento o Chen y Liu procedimiento que ha sido incorporado en el software como AUTOBOX, SPSS, SAS o de la tsoutlier paquete en R.

Posibles Problemas:

Siguientes son los problemas a los que se encontraría si el modelo de datos de series de tiempo mediante MODELOS de regresión múltiple.

  • Los errores pueden ser autocorrelated. Ver este agradable sitio web y este sitio web explicando este problema. Una forma de evitar esto es el uso Generalizado de menos plazas (GLS) o ARIMAX enfoque vs OLS de regresión múltiple, donde usted puede corregir la auto correlación.
  • OLS modelo no se parsimonoius. Ha $6+30+11= 47$ variables ficticias por la estacionalidad.
  • Mediante el uso de variables ficticias, usted está asumiendo que su estacionalidad es determinista, es decir, no cambia con el tiempo. Ya que solo tiene 3 años de datos que no se preocupe, pero todavía vale la pena a la trama de la serie y ver si la estacionalidad no cambia.

Y hay muchas más desventajas del uso de regresión múltiple. Si la predicción es más importante para usted, entonces yo se mantenga, al menos, 6 meses de datos y prueba de la capacidad de predicción de la regresión múltiple. Si su objetivo principal es explicar la correlación entre las variables independientes, entonces yo estaría cauteloso mediante regresión múltiple, y en su lugar me gustaría utilizar una serie de tiempo de enfoque, tales como la ARIMAX/GLS.

Si usted está interesado, usted puede consultar la excelente texto por Pankratz, para la función de transferencia y dinámica de modelos de regresión. Para la general de las series de tiempo de previsión consulte Makridakis et al. También, un buen texto de referencia sería por Diebold para la regresión y series de tiempo basado en los pronósticos.

4voto

Owen Fraser-Green Puntos 642

Lo que usted necesita es un modelo que incorpore a efectos diarios, semanales efectos, mensuales efectos,semana del mes de efectos, el día de los meses de efectos,el plomo y el retraso de los efectos de las vacaciones, sin especificar, pero empíricamente identificables nivel/paso turnos , tiempo local de las tendencias, los cambios en los impulsos y las legumbres, mientras que la incorporación de ARIMA estructura y posiblemente lidiar con los cambios en los parámetros y la varianza de error a lo largo del tiempo. Esto se llama una Función de Transferencia, y puede ser fácilmente reexpresado (PERO NO PARSIMONIA) como una Regresión Lineal Múltiple.

En específico un diario indicador de tomar 6 predictores. En general uno tiene que organizar cuidadosamente(identificar) ¿qué tipo de factores son necesarios. Si usted tiene un montón de tiempo en sus manos, usted puede experimentar con algunas de las estructuras que se han mencionado. Alternativamente, usted puede ser que necesite algunos de los más avanzados de software y consultoría para llegar a solucionar su problema en su vida.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X