Un ensayo con sólo dos resultados posibles (un "éxito" y "fracaso") a menudo se llama un ensayo de Bernoulli. Parece que es lo que tenemos aquí. Vamos a llamar a un éxito "tierras 00" y un fracaso "tierras de todo lo demás".
Una extensión obvia de esta idea es un experimento binomial, donde se ejecuta un número fijo de ensayos de Bernoulli ($n=500$ a partir de su descripción), cada uno de los cuales tiene la misma probabilidad de éxito ($p=\frac{1}{38}$ para un estándar de rueda de ruleta Americana). Estos definen un experimento Binomial, o binomial distribuido variable aleatoria. Hacemos un seguimiento de la cantidad de éxitos demasiado, y llamar a ese $k$. Entonces, para un experimento Binomial, la probabilidad de ver exactamente $k$ éxitos:
$$
P(k) = \binom{n}{k} p^{k} (1-p)^{n-k}.
$$
Conectar sus números, obtenemos
$$\begin{alignat}{3}
P(k) &= \binom{500}{1} &\cdot \bigg(\frac{1}{38}\bigg)^1 &\cdot \bigg(\frac{37}{38}\bigg)^{500-1}\\
&= 500 &\cdot \bigg(\frac{1}{38}\bigg) &\cdot \bigg(\frac{37}{38}\bigg)^{499}\\
&\approx 2.19 \times 10^{-5}\end{alignat}$$
Si se toma la ecuación de distancia, es fácil ver donde cada una de las tres piezas. El primero, el coeficiente binomial $\binom{n}{k}$, indica cuántas maneras que usted podría haber observado $k$ éxitos durante la $n$ ensayos. En este caso, es de 500 porque podría haber sido el primer, segundo, ..., o en la última prueba. El siguiente componente indica la probabilidad de observar los $k$ éxitos, mientras que el último le dice que la probabilidad de observar el resto de los fracasos. Como usted puede, al recordar que la probabilidad de fallo debe ser $1-p$ desde a) el éxito y el fracaso son nuestras únicas opciones b) son mutuamente excluyentes y c) mutuamente exclusivos y exhaustivos probabilidades suma a uno.
Ir a través de la distribución binomial es bueno porque podemos adaptar este formalismo para calcular otras cosas, como la probabilidad de ver $k$ o más (o $k$ o menos) de los éxitos en su lugar, que podría ser más relevante.
Tenga en cuenta que estos valores son para una sola, pre-especificado lugar en la rueda. Tal vez usted siempre jugar su madre, fecha de nacimiento, he oído un rumor de que el casino fue el jugador tramposo y desea comprobar. El $p$-valor que obtiene de este cálculo será correcto en este caso.
Ahora, considere un escenario ligeramente diferente. Supongamos que usted apuntes sobre el resultado de cada tirada (es raro casino) y revisado cuando llegó a su casa. Observa que "00" fue la menos probable resultado y comenzar a preguntarse si algo raro está sucediendo. En este caso, el $p$-valor que se calcula que va a ser engañoso, porque se han utilizado los mismos datos para generar hipótesis y la prueba de ello. Este efecto es sorprendentemente fuerte, como se puede ver en una simulación. Empecé por la generación de 500 enteros entre 1-38 y tabular la frecuencia de cada número se ha producido. Esto imita el resultado de una única sesión. Me repite este procedimiento 10.000 veces. En promedio, cada número viene hasta 1/38 de la época (13.15/500 ensayos), como era de esperar de una feria de la rueda de la ruleta. Sin embargo, la más rara de número en cada sesión sólo llega hasta 6.1/500 veces. La probabilidad de ver exactamente seis éxitos es bastante pequeño (~0.01), como es la probabilidad de ver seis o menos éxitos (~0.02), aunque nuestra simulación es, por construcción, la feria. Una forma de combatir este problema es dividir los datos. Usted podría utilizar una parte de los datos para generar una hipótesis, luego de probarlo en el resto de los datos.
Alternativamente, usted podría usar un $\chi^2$, o el chi-cuadrado de la prueba. Esta prueba compara su observó cuenta que el número esperado de cuenta (1/38 * 500). Esta directamente las pruebas de su hipótesis subyacente--la rueda de la ruleta es justo--sin dragado a través de los datos para encontrar un espacio específico para la prueba.