¿Qué métodos de confiabilidad entre evaluadores son los más apropiados para datos ordinales o de intervalo?
Creo que "Probabilidad conjunta de acuerdo" o "Kappa" están diseñados para datos nominales. Si bien se pueden usar "Pearson" y "Spearman", se usan principalmente para dos evaluadores (aunque pueden usarse para más de dos evaluadores).
¿Qué otras medidas son adecuadas para datos ordinales o de intervalo, es decir, más de dos evaluadores?