(Me disculpo por ser un newb, pero yo soy un investigador de presentarme a la minería de datos---cualquier ayuda o una idea, sería muy apreciado. También, esto no es técnicamente una tarea pregunta, pero he marcado como tal a distinguir que esta es una cuestión amplia de un no especialista).
Estoy teniendo problemas para encontrar el enfoque correcto para mi (bastante simple) ejemplo.
Digamos que tengo meses de datos para el registro de los horarios de un determinado sitio web. Los datos ha sido seleccionada y limpia que tengo una lista de Fecha_hora para cada sesión.
Ahora, supongamos que yo quería para predecir el log-ins para las próximas dos semanas por día y hora, basado en estas tendencias pasadas.
Me imagino que permitiría agrupar los datos por día (suponiendo de antemano que habrá diferentes tendencias con respecto a lunes frente a viernes) y hacer algunos análisis de regresión para predecir los próximos dos (dicen) los lunes.
Del mismo modo, yo podría clúster de la hora y hacer un análisis de regresión para extrapolar la tendencia de los log-in.
Alguien sabe de un recurso que le dice cómo hacer esto en Python? Quiero mantener este ejemplo bastante sencillo, pero estoy abierto a otras ideas sobre cómo modelar este comportamiento de manera más eficiente.