Soy nuevo en los cálculos de confiabilidad entre evaluadores.
Tengo 5 desarrolladores y 6 evaluadores. Los evaluadores clasificaron a los primeros 3 de estos desarrolladores basados en ciertos criterios como en el siguiente ejemplo:
Por ejemplo,
dev1 dev2 dev3 dev4 dev5
ranker1 1 2 3
ranker2 3 1 2
ranker3 3 1 2
ranker4 1 3 2
ranker5 2 1 2
ranker6 3 1 2
Las calificaciones miden el "nivel de experiencia": "1" la mejor experiencia, "2" menos experiencia, y "3" la menor experiencia.
¿Cuál es el mejor algoritmo para calcular la confiabilidad entre evaluadores en este caso?