En mi experimento, invité a 3 expertos para que evaluaran el rendimiento de la danza de 20 sujetos. Por lo tanto, cada sujeto obtendrá 3 puntuaciones dadas por el experto de forma individual. Para la mayoría de los sujetos, la evaluación de los tres expertos es coherente. Sin embargo, en varias asignaturas, las puntuaciones dadas por los expertos son muy diferentes. Por ejemplo, para el tema 01, el experto A da una puntuación de 70, el experto B da una puntuación de 50, el experto C da una puntuación de 30. Pero para otros temas, las diferencias son muy pequeñas. Ya utilicé el coeficiente de correlación intraclase para comprobar la consistencia entre la evaluación de los 3 expertos, y resultó bien, lo que significa que la evaluación general entre los 3 expertos es consistente. Por lo tanto, quiero saber si hay algún método estadístico para detectar los temas cuya puntuación no es consistente entre los 3 expertos. Quiero eliminar estos sujetos como valores atípicos.
Sólo he adjuntado una figura para mostrar la evaluación de los expertos. Pero todavía espero que haya una forma estadística de eliminar algunos valores atípicos. Muchas gracias.