9 votos

Ponderado Kendall tau coeficiente de correlación

Necesito usar una medida para comparar dos clasificaciones:

Considerar el terreno de la verdad como 1,2,3,4,5,6. Vamos dos clasificaciones de ser R1 y R2.

R1: 1,2,3,6,4,5
R2: 1,4,2,3,5,6

De Wikipedia, la tau de Kendall ranking coeficiente de correlación está dada por: $$ \frac{\text{Número de Pares Concordantes - Número de Pares Discordantes}}{(n(n-1)/2) } $$ Cálculo de la tau de Kendall para R1:

Number of Concordant Pairs = 15
Number of Discordant Pairs = 2

Asimismo, para R2:

Number of Concordant Pairs = 15
Number of Discordant Pairs = 2

Así, aunque el de Kendall coeficiente de correlación es el mismo para ambas listas, quiero penalizar R2 más como las diferencias en la posición es hacia la cabeza de la cola. Por lo tanto, junto con el ranking, también quiero tomar en consideración la posición. Hay una bien definida medida para esto? Cómo puede hacerse esto?

4voto

Ochado Puntos 126

No tengo comentarios privilegios, así que voy a intentar una respuesta aquí. Tal vez tu pregunta original no está claro, pero aquí están las respuestas dependiendo de su significado exacto:

"Quiero penalizar R2 más como las diferencias en la posición es hacia la cabeza de la cola. Por lo tanto, junto con el ranking, también quiero tomar en consideración la posición."

  • Si usted quiere penalizar R2 porque se mueve demasiado hacia la posición 1, a pesar de su respuesta a otra pregunta, ¿la atención acerca de la relevancia. En otras palabras, si los errores demasiado hacia la cabeza o hacia la cola de la materia, de relevancia basado en la clasificación es lo que usted está buscando. La otra respuesta a la sugerencia de Descuento ganancia acumulada es una buena opción.
  • Como alternativa, no sé si pensar que en R2 que hubo un mayor cambio absoluto o salto en el ranking, para el que se quiere dar una pena. De hecho, la diferencia en ambos casos es de -2: En R1, 6 movido rango de -2 a 4; en R2, 4 movido de -2 a 2. Por lo tanto, la tau de Kendall es idéntico, porque tau sólo se preocupa por cuánta diferencia hay, no se donde exactamente el salto se ha producido. Si, por ejemplo, solamente había un salto en 1 (por ejemplo, si R3 se 2,1,3,4,5,6), entonces tau tendrían un mayor valor (lo que indica más de concordancia). Si ese es el caso, entonces la tau de Kendall podría ser justo lo que necesita.

2voto

Anthony Lewis Puntos 769

No sé si es posible con la tau de Kendall, pero algunas medidas de ranking como ganar con descuento acumulado naturalmente penalizan más inversiones hacia algún extremo de la lista.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X