Tengo 3 calificadores que han calificado a 9 sujetos. Se han realizado pruebas similares con diferentes calificadores y diferentes temas, y necesito comparar en qué medida los diferentes calificadores han coincidido en sus respectivos temas. He elegido la W de Kendall porque estoy utilizando datos ordinales (1 = no estoy de acuerdo en absoluto, 5 = estoy completamente de acuerdo). Ahora, me resulta muy difícil entender por qué los resultados se ven así cuando los comparo con los diagramas de violín que he creado de las calificaciones.
library("DescTools")
rtr1 <- c(5,5,5,5,5,5,4,5,5)
rtr2 <- c(5,5,5,5,5,5,5,5,5)
rtr3 <- c(3,3,3,4,4,4,4,4,4)
ratings <- cbind(rtr1, rtr2, rtr3)
KendallW(ratings, test=TRUE, correct=TRUE)
Paket ‘DescTools’ wurde unter R Version 3.4.1 erstellt
Kendall's coefficient of concordance Wt
data: ratings
Kendall chi-squared = 6.1538, df = 8, subjects = 9, raters = 3, p-value = 0.63
alternative hypothesis: Wt is greater 0
sample estimates:
Wt
0.2564103
Sin embargo, en el diagrama del violín, las clasificaciones están muy cerca unas de otras.
Ahora, cuando miro otro conjunto, las clasificaciones parecen estar menos cerca unas de otras:
rtr1 <- c(3,4,5,3,3,5,3,2,5)
rtr2 <- c(1,3,2,1,3,2,1,1,1)
rtr3 <- c(3,2,3,3,3,3,2,2,2)
Sin embargo, en este caso W es 0,4064815. En otras palabras, hay más acuerdo en las valoraciones. ¿Cómo puede ser este el caso dados los datos? ¿Es la W de Kendall una buena opción en este caso, dado que las valoraciones no están clasificadas?