@Irishstat cubierto prácticamente lo que iba a decir, pero me gustaría responder con mi propia experiencia personal en el modelado de estos datos con series de tiempo y regresión de MCO de la regresión.
Si es una tarifa diaria de datos, a continuación, me gustaría hacer lo siguiente:
Crear una variable ficticia para los diferentes estacionalidad:
- Para capturar día de la semana de la estacionalidad, crear 6 variables ficticias.
- Para capturar día del mes de la estacionalidad, crear 30 variables ficticias
- Para la captura de los meses del año, crear 11 variables ficticias.
Crear variable ficticia para variables de tendencia:
Si la serie de tiempo de las exhibiciones de tendencia lineal, a continuación, agregar una tendencia del tiempo
variable.
Si la serie de tiempo exhibe tendencia no lineal, agregar un tiempo no lineal
tendencia de variables tales como la cuadrática/cúbico/log
Agregar variables Independientes Variables
Esta es una serie de tiempo de datos, por lo que debe tener cuidado acerca de plomo y
gal efectos de independiente varibales. Por ejemplo, en tu ejemplo,
usted menciona a precio promocional bandera, no podría haber
efecto inmediato en su respuesta, es decir, no puede ser retrasada y
una descomposición/permanente efecto. Así, por ejemplo, si ejecuta una promoción
hoy en día, usted puede tener un aumento en las ventas hoy en día, pero el efecto de
la promoción se desintegra después de unos pocos días. No hay ninguna manera fácil para este modelo
mediante regresión múltiple, puede que desee utilizar la función de transferencia
modelado que es parsimonoius y puede manejar cualquier tipo de plomo y
gal efectos. Ver este ejemplo he publicado anteriormente, donde hay
una intervención(en el caso de punto de precio) y hay un abrupto
aumento, seguido por una descomposición efecto. Después de haber dicho que si usted tiene a priori el conocimiento sobre el plomo y el lag efecto, crear variables adicionales en su caso las variables ficticias antes y después del punto de precio y (sí/no) la promoción del cambio.
También habría que agregar movimiento Vacaciones indicador variables, por ejemplo, como Irishstat señaló que desee agregar/Pascua día de acción de gracias (en estados unidos) que se están moviendo los días Festivos. Los días festivos que están fijadas las fechas serán automáticamente cuidado de si usted está utilizando el maniquí esquema de codificación para captura de estacionalidad.
Además, sería necesario para identificar valores atípicos tales como aditivo/pulso (una sola vez) o de cambio de nivel (cambio permanente) y agregarlos como regresores. La identificación de valores atípicos en varios de regresión para datos de series de tiempo es casi imposible; necesitaría tiempo de la serie de valores atípicos en los métodos de detección, tales como Tsay del procedimiento o Chen y Liu procedimiento que ha sido incorporado en el software como AUTOBOX, SPSS, SAS o de la tsoutlier
paquete en R.
Posibles Problemas:
Siguientes son los problemas a los que se encontraría si el modelo de datos de series de tiempo mediante MODELOS de regresión múltiple.
- Los errores pueden ser autocorrelated. Ver este agradable sitio web y este sitio web explicando este problema. Una forma de evitar esto es el uso Generalizado de menos
plazas (GLS) o ARIMAX enfoque vs OLS de regresión múltiple,
donde usted puede corregir la auto correlación.
- OLS modelo no se parsimonoius. Ha $6+30+11= 47$ variables ficticias por la estacionalidad.
- Mediante el uso de variables ficticias, usted está asumiendo que su estacionalidad es
determinista, es decir, no cambia con el tiempo. Ya que solo tiene 3
años de datos que no se preocupe, pero todavía vale la pena
a la trama de la serie y ver si la estacionalidad no cambia.
Y hay muchas más desventajas del uso de regresión múltiple. Si la predicción es más importante para usted, entonces yo se mantenga, al menos, 6 meses de datos y prueba de la capacidad de predicción de la regresión múltiple. Si su objetivo principal es explicar la correlación entre las variables independientes, entonces yo estaría cauteloso mediante regresión múltiple, y en su lugar me gustaría utilizar una serie de tiempo de enfoque, tales como la ARIMAX/GLS.
Si usted está interesado, usted puede consultar la excelente texto por Pankratz, para la función de transferencia y dinámica de modelos de regresión. Para la general de las series de tiempo de previsión consulte Makridakis et al. También, un buen texto de referencia sería por Diebold para la regresión y series de tiempo basado en los pronósticos.