8 votos

La definición de "rango de promedio" cuando no todos los ranking cubre todo el conjunto

He aquí un modelo matemático problema que me encontré mientras trabajaba en un proyecto hobby.

Tengo un sitio web que presenta a cada visitante una lista de los títulos de la película. El usuario tiene que el rango de más a menos favorito. Después de cada visita, quiero crear un acumulado de clasificación que toma en cuenta a cada visitante del ranking individual. Normalmente sólo quiero tomar la media ordinal rango: por ejemplo, si la Persona a la calificación de "Avatar" 10 y la Persona B calificó 20, su acumulativa rango sería de 15. Sin embargo, las nuevas películas será añadido a la lista a medida que la web crece, por lo que cada persona se han clasificado con sólo un subconjunto de la película completa la lista.

Alguna idea de cómo puedo definir "rango de promedio" cuando algunos rankings no cubren todo el conjunto? Mi mejor idea es, hasta ahora, a este modelo como un grafo dirigido, donde los nodos son las películas y ponderada de los bordes son de preferencias (por ejemplo, "10 personas ranking 'Avatar' justo encima de 'Distrito 9'") y, a continuación, encontrar sumideros y fuentes. ¿De qué otra manera se podría ir sobre esto?

(Lo siento si esta pregunta es demasiado aplicados).

5voto

Hugo Puntos 2156

Hay un par de maneras diferentes de abordar el problema. Una buena referencia para este problema es"Clasificar los métodos de Agregación Para La Web', por Obra, Kumar, Naor y Sivakumar de la web de la conferencia en el año 2001. No es el más reciente trabajo, sino que establece las matemáticas muy bien.

En general, la forma de definir un promedio es definir una métrica y, a continuación, busque en el punto que minimiza la suma de distancias a partir de las listas individuales. Si las listas se completa (i.e todo definida sobre el mismo conjunto), podría usar Spearman footrule distancia, o el de Kendall distancia. Ya que ellos no son, en general, la idea es encontrar la clasificación mundial que localmente óptima (he.e no hay otro lleno de clasificación que se obtiene una distancia menor a las listas parciales y pueden ser obtenidos mediante el seteo de los rankings de la actual candidato). Como un aparte, usted puede comparar una completa clasificación con un parcial de clasificación por el mero hecho de proyectar el pleno de la clasificación en el ranking parcial y, a continuación, la computación uno de los mencionados distancias.

La mayoría de esta se desarrolla en detalle en el documento de referencia, así que lo mejor es comenzar por ahí.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X