Comentario: Te deseo éxito con el enfoque de @HennoBrandsma (+1). Parece que habrá que hacer un poco de contabilidad al considerar todas las posibilidades. En caso de que sea de alguna utilidad (por ejemplo, para comprobar los resultados intermedios), aquí están simulados distribuciones simuladas para las puntuaciones de Estudiante 1, Estudiante 2 y Diferencia.
Es razonable esperar que las probabilidades simuladas tengan una precisión de dos o tres lugares.
Aunque el Estudiante 1 lo hará ligeramente mejor de media, parece que hay algo menos de un 50:50 de posibilidades de que Estudiante 1 haga mejor que el Estudiante 2. Sin embargo, hay unas 3 posibilidades entre 4 de que el Estudiante 1 haga tan bien o mejor.
set.seed(429)
m = 10^6; p1=c(3,4,9,7,1)/10; p2=c(4,5,2,8,1)/10
s1 = replicate(10^6, sum(rbinom(5, 1, p1)))
round(table(s1)/m,3)
s1
0 1 2 3 4 5
0.011 0.142 0.398 0.340 0.101 0.008
s2 = replicate(10^6, sum(rbinom(5, 1, p2)))
round(table(s2)/m,3)
s2
0 1 2 3 4 5
0.043 0.260 0.407 0.236 0.051 0.003
d = s1 - s2
round(table(d)/m,3)
d
-5 -4 -3 -2 -1 0 1 2 3 4 5
0.000 0.001 0.011 0.060 0.172 0.285 0.272 0.148 0.044 0.006 0.000
mean(s1 > s2)
[1] 0.471404
mean(s1 >= s2)
[1] 0.756087
par(mfrow=c(1,3))
hist(s1, prob=T, br=(0:6)-.5, col="skyblue2", main="Student 1 Scores")
hist(s2, prob=T, br=(0:6)-.5, col="skyblue2", main="Student 2 Scores")
hist(d, prob=T, br=(-5:6)-.5, col="skyblue2", main="Difference in Scores")
abline(v = .5, col="red", lwd=3, lty="dashed")
par(mfrow=c(1,1))