La prueba de Friedman parece apropiada para probar su hipótesis nula aquí.
Equivale a una prueba de significación de W de Kendall que a veces se utiliza como índice de acuerdo entre clasificaciones que oscila entre $0$ (sin acuerdo, clasificaciones esencialmente aleatorias) y $1$ (acuerdo total, todos los rangos son idénticos).
En su caso tiene $m=5$ pruebas y $n=4$ estudiantes, y el Friedman $\chi^2 = 3.96, \space p = .266$ . Este resultado puede transformarse para encontrar la W de Kendall mediante $\chi^2/(m(n-1))$ . En sus datos, $W = .264$ .
Se puede pensar en esto de forma equivalente, calculando todas las correlaciones de rango de Spearman entre cada par posible de clasificaciones mensuales y encontrando la media. La correlación media de Spearman es $(mW-1)/(m-1)$ que para sus datos da como resultado $.08$ . No es una correlación muy fuerte.
Con un poco de álgebra, se puede hallar la correlación media de Spearman entre las clasificaciones directamente desde el Friedman $\chi^2$ resultado
$$\frac{\chi^2-n+1}{(m-1)(n-1)}$$
Obsérvese que Ehrenberg (1952) ofrece una prueba similar utilizando la correlación Tau de Kendall media.
Referencias
Ehrenberg, A. S. C. (1952). On sampling from a population of rankers. Biometrika, 39(1/2), 82-87.
Kendall, M. G. y J. D. Gibbons. 1990. Rank Correlation Methods. 5th ed. London: Griffin.