20 votos

¿Cómo predecir cuándo se producirá el próximo acontecimiento basándose en los tiempos de los acontecimientos anteriores?

Soy estudiante de bachillerato y estoy trabajando en un proyecto de programación informática, pero no tengo mucha experiencia en estadística y modelización de datos más allá de un curso de estadística de bachillerato, así que estoy algo confuso.

Básicamente, tengo una lista razonablemente grande (asumo que es lo suficientemente grande como para cumplir los supuestos de cualquier prueba o medida estadística) de veces que alguien decidió imprimir un documento. Basado en esta lista, me gustaría construir un modelo estadístico de algún tipo que prediga el momento más probable para el siguiente trabajo de impresión dado todos los tiempos de eventos anteriores.

Ya he leído este pero las respuestas no me ayudan exactamente con lo que tengo en mente para mi proyecto. Hice algunas investigaciones adicionales y encontré que un Modelo de Markov oculto probablemente me permitiría hacerlo con precisión, pero no puedo encontrar un enlace sobre cómo generar un Modelo de Markov Oculto utilizando sólo una lista de tiempos. También he encontrado que el uso de un Filtro Kalman de la lista pueden ser útiles, pero básicamente, me gustaría obtener más información al respecto de alguien que realmente los haya utilizado y conozca sus limitaciones y requisitos antes de simplemente probar algo y esperar que funcione.

¡Muchas gracias!

11voto

Bryan Rehbein Puntos 3947

Los modelos de Markov ocultos se aplicarían si los datos fueran emisiones aleatorias de algún modelo de Markov subyacente no observado; no lo descartaría, pero no parece un modelo muy natural.

Pensaría en procesos puntuales que se ajustan bien a sus datos particulares. Hay una gran cantidad de trabajo sobre la predicción de terremotos (aunque no sé mucho al respecto) e incluso delito .

Si hay muchas personas diferentes imprimiendo, y sólo ves las horas pero no las identidades individuales, un proceso de Poisson podría funcionar bien (la superposición de múltiples procesos puntuales independientes es aproximadamente Poisson), aunque tendría que ser no homogéneo (la probabilidad de un punto varía con el tiempo): es menos probable que la gente esté imprimiendo a las 3 de la mañana que a las 3 de la tarde.

Para el proceso de Poisson no homogéneo modelo, la clave estaría en obtener una buena estimación de la probabilidad de un trabajo de impresión a una hora concreta de un día concreto.

Sin embargo, si estos tiempos de impresión son para alumnos de una clase, podría ser bastante complicado, ya que no es probable que sean independientes y, por tanto, el proceso de Poisson no funcionaría bien.

Enlace a un artículo en la solicitud de delito.

1voto

Van Assassin Puntos 8

Basarse en la predicción del tiempo probable utilizando la estadística de exploración bayesiana multivariante (MBSS) podría ser de ayuda. Este MBSS tiene la ventaja de mejorar la puntualidad y la precisión de la detección de eventos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X