Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

3 votos

Previsión del gasto de los clientes

Estoy pronosticando el gasto del cliente basándome en el conjunto de datos de las series temporales. He intentado construir dos modelos:

  • Arima
  • regresión. '

Con el modelo Arima, pude prever con bastante precisión el gasto de los clientes en un día normal. Sin embargo, tanto en mi conjunto de datos como en la realidad actual, el primer día de cada mes, debido a la promoción mensual, el gasto de los clientes es siempre significativamente mayor que el de los demás días. Por lo tanto, con los modelos Arima, por el momento no he podido predecir con exactitud el gasto de los clientes el primer día del mes. Con el modelo de regresión, la cifra prevista para el gasto de los clientes el primer día del mes fue más precisa que la prevista con el modelo Arima.

Sin embargo, con un R2 de sólo el 50%, la fluctuación de los valores previstos para otros días es muy alta. ¿Puede aconsejarme métodos que pueda utilizar para mejorar mis modelos o hay algún otro modelo que pueda ayudarme a predecir el gasto con precisión tanto en los días normales como en el primer día del mes? Aquí está una pequeña parte de mis datos enter image description here

1voto

Owen Fraser-Green Puntos 642

La combinación de ARIMA e indicadores ficticios es una muy buena dirección. Empíricamente Encontrar qué días del mes son importantes es una característica importante del software . Véase el estudio de la demanda diaria en http://autobox.com/cms/index.php/afs-university/intro-to-forecasting/doc_download/53-capabilities-presentation y suumarizado aquí enter image description here . Es necesario integrar de forma robusta estas características junto con cualquier serie de predicción especificada por el usuario.

Si desea publicar sus datos, trataré de ayudarle más y presentaré sus datos a AUTOBOX (mi herramienta preferida, que he ayudado a desarrollar).

Es ingenuo tratar de separar los días particulares de los días normales, ya que uno necesita incorporar sin problemas los efectos diarios/meses, los efectos de las historias de nivel, los efectos de la memoria. los efectos de las vacaciones sin ser sorprendido/afectado por las anomalías que no representan el "comportamiento típico", por lo que es necesario limpiar la parte/efecto anómalo.

EDITADO tras recibir los datos que incluyen dos "variables de ayuda" sugeridas por el usuario, a saber, el día 1 del mes y un indicador de vacaciones colectivas. El operador no pudo publicar sus datos en SE, así que me los envió por correo electrónico. Estaré encantado de enviárselos junto con mis resultados analíticos a cualquier lector interesado. Envió dos series temporales típicas Una de ingresos para prepago y otra para postpago (1061 días consecutivos) . La serie de postpago está aquí enter image description here lo que da como resultado un modelo que proporciona los siguientes datos reales/ajustes y previsiones enter image description here con previsiones a 90 días aquí enter image description here . La ecuación está aquí en dos partes. enter image description here y enter image description here . Hay una estructura ar(7) muy fuerte que sugiere un componente de memoria diaria junto con dos indicadores mensuales.

La serie de prepago era un poco más interesante . Aquí está enter image description here con previsiones aquí enter image description here . El útil modelo que AUTOBOX proporcionó automáticamente está aquí en dos partes enter image description here y aquí enter image description here . El resumen de las estadísticas está aquí enter image description here . El enter image description here los residuos del modelo están aquí con acf aquí enter image description here sugiriendo la suficiencia del modelo. El gráfico depurado es interesante enter image description here . Por último, el gráfico Real/Ajuste y Previsión enter image description here . Obsérvese que se han encontrado/descubierto varios días del mes que son significativos, además de la variable day1 sugerida por el usuario.

Navidad/final de año es ciertamente importante para ambas series mientras que la serie de prepago es muy estacional (factores mensuales dentro del año) la serie de postpago es también muy "estacional" con respecto a los días dentro de la semana.

La mayor parte de los datos diarios (si no todos) relacionados con la actividad humana tienen características similares, ya que somos criaturas de costumbres. Los datos diarios de las comillas bursátiles ..... no lo son tanto, ya que están impulsados en gran parte por la emoción, que no es tan cuantificable.

Ambos modelos combinan la memoria (arima) y la estructura determinista . Hay que tener en cuenta que en el estudio de prepago no se incluyeron las previsiones para las vacaciones futuras, ya que no se entregaron, lo que sesgó las previsiones a la baja cuando comenzó la actividad vacacional.

Otro comentario para determinar si los días festivos individuales son importantes (como suelen serlo), ya que ningún coeficiente puede explicar la estructura principal, contemporánea y de retraso en torno a cada evento festivo, AUTOBOX necesita conocer la lista de días festivos (a través de archivos de datos residentes) y cuándo han ocurrido y ocurrirán en el horizonte de planificación. Estos datos proceden de Vietnam, pero hemos utilizado un calendario genérico europeo/estadounidense para este estudio preliminar pero muy informativo.

El hecho de que el día de San Patricio sea importante para Vietnam refleja, sin duda, una festividad no especificada (fiesta coincidente) que llega alrededor o el 17 de marzo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X