Clúster de datos de seguimiento de clics

Question

Clúster de datos de seguimiento de clics

Preguntado el 9 de Julio, 2012: Cuando se hizo la pregunta
1050 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Abierta: Estado actual de la pregunta

Recientemente he entrado en el reino de aprendizaje de máquina y un proyecto en el que estoy trabajando me obliga a los usuarios del clúster basado en el orden en que han visitado las páginas web de un sitio web. Tengo los datos en la forma de:

['user_id', 1, 2, 4, 6, 3, 7, 3, 2, 4...]

Donde cada número es una categoría/página que el usuario visitó. Además, la longitud de los datos de cada usuario no es el mismo es decir, algunos usuarios visitan más páginas de las que otros.

Me doy cuenta de que esto es muy ambiguo y la definición de similitud es duro. Traté de seguir el ejemplo de este trabajo de investigación y para ser honesto, mucho de eso se fue por encima de mi cabeza.

Necesito ayuda en la forma de abordar este problema y estoy abierto a nuevas ideas y sugerencias.

Preguntado el 9 de Julio, 2012 por Arjun Aletty

Answer 1

1 Respuestas

Answer 2

3voto

Miroslav Sabo Puntos 1548

Es una buena pregunta con muchas aplicaciones prácticas.

Sus datos son secuenciales, de modo que necesitamos una medida de similitud entre cualquier par de secuencias. Recomiendo Levensthein distancia , ya que es muy intuitiva y muy bien definido. Ver también este bonito tesis de licenciatura , con una visión de más medidas para datos secuenciales.

Finalmente, si uno dispone de las distancias entre todos los pares de secuencias, se puede utilizar cualquier algoritmo de clustering que toma distancia de la matriz como de entrada (por ejemplo, cualquier algoritmo jerárquico).

Respondido el 9 de Octubre, 2012 por Miroslav Sabo (1548 Puntos )

Clúster de datos de seguimiento de clics

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Clúster de datos de seguimiento de clics

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: