El más simple análisis es el número de victorias.
Deje $n$ el número de juegos independientes, y $X$ el número de premios para el Jugador B.
A continuación, bajo la hipótesis nula de que los jugadores son igualmente probables
para ganar un juego, $X \sim \mathsf{Binom}(n, 1/2)$.
Si B está a la cabeza con $x > n/2$ que se observa en gana, se podría rechazar la hipótesis nula (y la conclusión de
que B es más hábil), si $P(X \ge x)$ es muy pequeña. Más pequeños
la 0.025 podría ser un criterio razonable.
En su caso, $n = 10$ $P(X \ge 7) = 1 - P(X \le 6) = 0.1719,$
que no es muy pequeña. (El cálculo de R estadísticas
el software se muestra a continuación).
1 - pbinom(6, 10, .5)
## 0.171875
Si tuviéramos $x = 9$$P(X \ge x) = 0.0107,$, lo que podría ser persuasivo
a usted o a una persona neutral, pero posiblemente no a su esposa, que se inicia
con una profunda creencia de que rummy es un juego de azar.
No es la proporción de victorias que gobierna el resultado. Si
Jugador B $x = 35$ observado gana en $n = 50$ juegos, entonces el
cálculo sería $P(X \ge 35) = 1 - P(X \le 34) = 0.0033,$
una persuasiva resultado. Así que si usted mantiene su proporcional de plomo
para un mayor número de juegos, entonces usted tiene un buen caso de que se
más hábil.
Si desea buscar en una estadística de libros de texto en " una muestra de la
prueba binomial', usted puede encontrar
más explicación técnica. También, tal vez algo acerca de un
aproximación normal, lo que podría tener sentido para $n = 50,$ pero
no para que unos pocos como $n = 10$ juegos.
El uso de las puntuaciones requeriría un conocimiento de rummy que yo no tengo.
Si el ganador tiene puntaje $12,$ ¿tiene sentido decir que el perdedor
ha score $-12?$ Si es así, aquí es una forma de la prueba estadística.
Me resulta difícil creer que estas puntuaciones son
normal, así que estoy usando una muestra de Wilcoxon ('signed-rank') prueba de
de la hipótesis de que la población puntuación media es $0$ contra los dos
cara alternativa que no lo es. Esta prueba no requiere de datos normal.
Los resultados de la I
software de herramientas estadísticas que se muestran a continuación. Ser persuasivo, lo que uno podría necesitar
el P-value
a ser menor que 0.05. (El mensaje de advertencia de que
hacer con los dos 4 en los datos, y el hecho de que la muestra de la mediana es de 4;
He investigado y encontrado que el P-valor debe estar por encima de 0.20.)
y = c(12,3,-5,-2,8,4,-17,5,17,4)
wilcox.test(y)
Wilcoxon signed rank test with continuity correction
data: y
V = 39, p-value = 0.2613
alternative hypothesis: true location is not equal to 0
Warning message:
In wilcox.test.default(y) : cannot compute exact p-value with ties
De nuevo aquí, es posible que los datos de más juegos con una permanente
la diferencia entre los jugadores de producir resultados significativos.