6 votos

Encontrar el método correcto de minería de datos

(Me disculpo por ser un newb, pero yo soy un investigador de presentarme a la minería de datos---cualquier ayuda o una idea, sería muy apreciado. También, esto no es técnicamente una tarea pregunta, pero he marcado como tal a distinguir que esta es una cuestión amplia de un no especialista).

Estoy teniendo problemas para encontrar el enfoque correcto para mi (bastante simple) ejemplo.

Digamos que tengo meses de datos para el registro de los horarios de un determinado sitio web. Los datos ha sido seleccionada y limpia que tengo una lista de Fecha_hora para cada sesión.

Ahora, supongamos que yo quería para predecir el log-ins para las próximas dos semanas por día y hora, basado en estas tendencias pasadas.

Me imagino que permitiría agrupar los datos por día (suponiendo de antemano que habrá diferentes tendencias con respecto a lunes frente a viernes) y hacer algunos análisis de regresión para predecir los próximos dos (dicen) los lunes.

Del mismo modo, yo podría clúster de la hora y hacer un análisis de regresión para extrapolar la tendencia de los log-in.

Alguien sabe de un recurso que le dice cómo hacer esto en Python? Quiero mantener este ejemplo bastante sencillo, pero estoy abierto a otras ideas sobre cómo modelar este comportamiento de manera más eficiente.

3voto

warren Puntos 177

Estoy de acuerdo con los comentaristas, este es un simple problema de series de tiempo. Si no te interesan los cambios estacionales, no estoy seguro de lo que esperas obtener de los simples recuentos diarios y por hora.

ARIMA es lo que quieres. Si realmente necesitas algo que sea específicamente aprendizaje de máquina, trata de modelar bayesiano básico. Sería incorporar sus datos anteriores y es la base de la mayoría de los paradigmas ML ....

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X