5 votos

Previsión/estimación de la demanda del cuarto de hotel diaria

Supongamos que tenemos un hotel y sabemos que todas las reservas de los últimos cinco años. Nos gustaría para predecir o estimar la habitación demanda día a día para el próximo año.

Soy un matemático, pero no un estadístico, lo siento si estoy diciendo algo trivial o tonto.

Me pregunto si el "modelo estándar" (como ARMA, ARIMA, SARIMA) existe un problema. La principal duda que tengo, es sobre la regularidad de la variable "nº de reservas". Es predecible?

Como matemático puedo entender un modelo para la predicción, pero yo no sé realmente el dominio de aplicación de dicho modelo.

Tomemos el ejemplo del día de Navidad. Se trata de un "evento regular" porque es el mismo día de cada año, así que me imagino que fácilmente se puede hacer una predicción, pero ¿qué tal la semana santa? Obviamente no puedo estimar por los datos que tengo, porque el día de la Pascua cambia cada primavera, necesito una extraordinaria información.

  1. Es un análisis de series temporales problema?
  2. modelos estándar de trabajo para este problema? (Acabo de leer acerca de ARMA, ARIMA, SARIMA y modelos lineales, en busca de series de tiempo)
  3. Si no es así, ¿existen otros modelos para el tratamiento de este caso?
  4. O, básicamente, es necesario invocar la experiencia de las personas que trabajan en el hotel? :)

Buscando en internet he encontrado muchas cosas en "previsión de la demanda de turismo", pero todos estos análisis tratar de estimar el número de turistas por mes (por la consulta en google, por los últimos años de datos, etc.). Pero tal vez estoy equivocado.

Gracias.

ACTUALIZACIÓN 20/01/17

Estoy tratando de tener una idea de los comentarios publicados hasta el momento. Sé que, incluso la Navidad, es más complicado porque depende del día ("la Navidad en un jueves llevará a viernes de ser llevado a crear un programa de cuatro días de fin de semana, por ejemplo", cit. @Wayne). Pero el punto es el mismo: son estas complicaciones "tratable" o no?

@AnscombesGimlet dijo que son tratables, pero me pregunto: ¿cuántas correcciones manuales qué tengo que hacer para tener un modelo adecuado? Si tengo que hacer un montón de correcciones de curso todavía estoy usando un "modelo", pero no voy a decir que es "estándar" y me respondió "No" a 2. Hasta lo que yo he entendido (y creo que es el mismo punto de @IrishStat), cada hotel tiene su propia historia y sus propias variables/coeficientes: un mecanismo para la comprensión de estas peculiaridades no existe(bueno, digamos que es la experiencia o el savoir-faire).

Dime si estoy equivocado. Supongo que soy uno de los mejores estadísticos entrenado en el arte negro de la serie de tiempo, ¿qué iba a hacer para enfrentar este problema? Aquí mi lista:

  1. Preparar todos los datos de mi hotel
  2. Inicio ploteo de datos con diferentes escalas de tiempo años/(temporadas)/meses/(semanas/días
  3. Encontrar tal vez diferentes "escalas de tiempo" (en lugar de trazar enero-febrero, etc, tal vez 15 de enero al 15 de febrero de etc, porque los datos se ve más uniforme)
  4. Empezar a utilizar mi método favorito (digamos ARIMA) y empezar a hacer alguna proyección sobre mis datos, con los parámetros que creo que se ajuste mejor a los datos que ya han estudiado.
  5. El nuevo modelo es un buen modelo.

No voy a hacer: 1. Preparar todos los datos de mi hotel 2. Tome por ejemplo, ARIMA con la norma de "parámetros" que me imagino que sería posible, ya más o menos creo que voy a tener un pick para el verano y de vacaciones 3. Su lanzamiento y, a continuación, tratar de entender los parámetros de ARIMA mirando a lo lejos es el modelo de la realidad 4. Aproximar el modelo a una buena.

La diferencia entre estos dos enfoques se puede percibir en este ejemplo:

Lo que si puedo cambiar el hotel? La primera técnica (que yo llamaría "no estándar") tiene que ser aplicada de nuevo si me llevo a un hotel diferente (y voy a pasar un montón de tiempo en él). La segunda(la que yo llamaría "estándar") podría ser implementada (más o menos) para cada hotel.

Así que ahora la pregunta es: ¿pueden los métodos de trabajo? ambos son fiables?

3voto

  1. Sí - pero que asumen incorrectamente ARIMA es el "estándar". No hay modelos estándar. Me gustaría recomendar encarecidamente la lectura de un libro de la serie de tiempo (de los cuales hay un gran número de excelentes libros gratis en línea). Normalmente cubrirá mediante modelos ARIMA con externos regresores, la dinámica de la regresión, ETS, modelos, etc.
  2. NA
  3. Tal vez, depende de lo que sus datos se parece.

Dependiendo de lo que usted está utilizando los datos y de qué forma importante la precisión del pronóstico es, hay una serie de enfoques, usted querrá probar usando series de tiempo de la validación cruzada y/o de la prueba de establecer límites. Pero, esencialmente, usted debe buscar en los modelos ARIMA que incluyen externo de regresores las variables para la Pascua. Vacaciones ¿ no caer siempre en el mismo índice de día/semana debido a los años bisiestos.

Ideas para propuestas para:

  1. El uso diario de los datos e incluir temporada regresores para vacaciones y especificar varios períodos estacionales (diaria, anual). Ya sabemos que la información que el modelo no (vacaciones) sería una muy mala idea no, al menos, prueba con ellos.

  2. Usted puede agregar los datos en un semanal o mensual nivel, previsión de aquellos y, a continuación, utilizar un patrón de distribución por mes, basado en la media móvil de ese mes, el volumen de años anteriores. Por ejemplo, el día 1 de diciembre, históricamente, ha tenido un promedio de 3% del volumen total en el mes, el día 2 se presenta un 2,3%, etc. El valor de este método es mensual pronóstico suele ser más precisos que los diarios, por el ruido a nivel de la señal en el diario la resolución.

  3. Estoy realmente impresionado con los avances recientes a través de Temporal Jerárquica de Previsión. Existe una implementación de esta metodología en el R ladrón paquete. Esta metodología puede trabajar muy bien en la alta frecuencia de los datos (diaria, semanal). Aún así, usted querrá incluir los días festivos como externos regresores, incluso a este modelo de marco desde el uso de hotel es probable altamente impactado por vacaciones.

  4. Temporada ingenuo mediante un ajuste lineal hacia arriba/hacia abajo basado en su año-sobre-año, la tendencia (generalmente decente para seguir con un enfoque ingenuo para la tendencia). Usted todavía necesitará en cuenta los años bisiestos y los días festivos, ya que no puede alinear el uso de este método.

La lectura de una buena práctica de previsión libro probablemente será el mejor lugar para empezar.

EDITAR: Gratis en línea práctica de previsión libro enlace:

https://www.otexts.org/fpp

3voto

Owen Fraser-Green Puntos 642

La previsión diaria de datos es el objetivo que parece, en la superficie de la vida cotidiana (juego de palabras) estándar de problema. Estándar de ain't ! Incluso libre de textos en línea podría no ser muy útil como "modelo de identificación es el problema/oportunidad" . Modelos de series temporales (ARIMA) la incorporación de serie de predictores (X) es la respuesta sugerida en la forma de X es a ser con paciencia disciovered. Es conocida como la Función de Transferencia y comúnmente se conoce como Dinámica de Regresión con ARIMA (XARMAX). ARIMA solo es definitivamente no es la norma, como también se necesita incorporar conocidos y desconocidos los efectos deterministas (X) como @anscombesgimlet sabiamente sugerido. Suavizado en un nivel más alto de frecuencia de semanas o de meses, trimestres o años como un "fudge factor" es a menudo (siempre !) inadecuada porque se supone proporcional de los factores que en mi opinión son a menudo una mala regla de oro, ya que a menudo (siempre) varían a lo largo del tiempo. El desarrollo diario de los modelos que incorporan la memoria (ARIMA) , diario efectos , en particular el día de los meses de efectos, el plomo y el retraso de los efectos alrededor de los días festivos, semanal y mensual de los efectos e incluso de la semana dentro del mes de efectos a largo fin de semana de efectos, mientras que lidiar con los cambios del día-de-la-semana efectos, el nivel de paso de los turnos , tiempo local de las tendencias y los cambios en las tendencias , usuario sugerido causal de variables como el clima/precio/promoción no es para los débiles de corazón o de aquellos sin recursos o un montón de codificación de tiempo en sus manos.

Además debe haber una cierta preocupación por los cambios en los parámetros y la varianza de error cambia a través del tiempo, ya que estos dos son a menudo violados por los "malos datos" que realmente no es malo, pero "la vida real" y no tratadas/ignorado puede lanzar mono-llaves en deficientes (estándar) de los análisis.

Me involucré en el negocio de la comprensión y el desarrollo de datos de soluciones basadas en software/para datos diarios cuando una "pequeña compañía de cerveza en San Luis que había caballos", preguntó a predecir (táctica) de las ventas diarias de 50 productos de 600.000 puntos de venta utilizando cualquier y todos los conocidos factores tales como la proyectada de los precios y de la temperatura, mientras que la incorporación de la posible canibalización de los factores. Nada como un buen ejemplo de la vida real para sacarle jugo !. De hecho me parece que los datos del mundo real, a menudo impulsa el desarrollo teórico como un impulso que no va a desaparecer.

Además de la lectura de lo que se puede encontrar en los recursos como SE le sugiero que familiarizarse con los posibles proveedores de soluciones locales/estadísticos capacitados en el negro-el arte de series de tiempo y de entregar un típico conjunto de datos para la diversión y el placer y su educación. La búsqueda SE para la cadena "DIARIO de DATOS" y buscar algunos de los subprocesos.

Usted puede comenzar mediante la publicación de una de sus series de tiempo aquí y ofrecer una recompensa para el éxito de una respuesta. Los datos no tiene que ser real , se podría codificarse de datos . Podría ser fabricado/simulado para reflejar la información que se encuentra oculto en los datos esperando a ser descubiertos o más probable es ignorado como puede ser el caso.

Como @whuber una vez que opinó y parafraseo de la memoria "hay un montón de maneras incorrectas de resolver un problema difícil y por lo general sólo una forma correcta"

Esta problemática es más compleja que la carga de la cerveza en los estantes del supermercado, porque la ocupación de los hoteles de predicción debe/debe incorporar la "reserva actual de la cuenta", que es conocido por todos el futuro de las fechas y varía a lo largo del tiempo. Este es un giro interesante que es a la vez una complicación y una oportunidad. Sería interesante para mí, para saber exactamente cómo este problema está siendo manejado por los métodos existentes, con el fin de elaborar una solución viable.

Usted no se preocupe acerca de si las vacaciones se producen como la mayoría de los pronósticos de los paquetes de forma rutinaria de manejar que la de contabilidad. Lo que usted debería preocuparse acerca de es "cómo detectar apropiado de avance y retardo efectos alrededor de los días festivos", entre otras cosas hasta ahora mencionados.

EDITADO 1/20

Como un ejemplo de lo que @darXider es lo que sugiere (con inclusión de efectos fijos ) mira http://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting/doc_download/53-capabilities-presentation .. diapositiva 49-68 . Use esto como un prototipo y aún si decodificar para rodar su propia solución examinar el enfoque. La representación de datos como usted sugiere que puede ser bastante tiempo intensivo y muy ineficientes y nunca sería suficiente/costo-efectiva para formar modelos útiles para cada uno de sus hoteles. Yo estaría buscando la productividad de ayudas a la utilización perfeccionó el modelo de identificación de esquemas donde podía encontrarlos. Como ya he sugerido es posible que desee obtener la ayuda de un experimentado diario de la serie de tiempo de estadística y ellos han de proporcionar orientación a usted. AUTOBOX que me ha ayudado a desarrollar una de datos basados en la solución de este con SAS y SPSS como otras dos posibilidades.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X