Processing math: 100%

23 votos

¿Cuántas veces debo lanzar un dado para evaluar con confianza su imparcialidad?

(Disculpas de antemano por el uso de un lenguaje lego en lugar de un lenguaje estadístico).

Si quiero medir las probabilidades de sacar cada cara de un dado físico específico de seis caras con una precisión de +/- 2% con una confianza razonable de certeza, ¿cuántas tiradas de muestra se necesitarían?

Es decir, ¿cuántas veces tendría que lanzar un dado, contando cada resultado, para estar un 98% seguro de que las posibilidades de que ruede por cada lado están entre el 14,6% y el 18,7%? (O algún criterio similar en el que uno estaría un 98% seguro de que el dado es justo dentro del 2%).

(Esta es una preocupación del mundo real para los juegos de simulación que utilizan dados y quieren estar seguros de que ciertos diseños de dados están aceptablemente cerca de 1/6 de probabilidad de sacar cada número. Hay reclamaciones que muchos diseños de dados comunes se han medido tirando un 29% de 1's al lanzar varios de estos dados 1000 veces cada uno).

1 votos

Esto es mucho más complicado que encontrar el intervalo de confianza para una binomial, ya que querrías mantener todas las probabilidades bajo control. Echa un vistazo a Documento de Hsiuying Wang sobre intervalos de confianza simultáneos para distribuciones multinomiales ( Revista de Análisis Multivariante 2008, 99, 5, 896-911). Puede encontrar algunos códigos en esta entrada del blog que también ofrece un rápido resumen de algunos de los trabajos realizados al respecto.

1 votos

Tenga en cuenta que si sólo está interesado en comprobar si salen 1's una buena cantidad de veces, esto simplifica mucho la cuestión.

2 votos

Es importante tener en cuenta que el "intervalo de confianza" no le da un "percentil de probabilidad de ser correcto". Sospecho que está utilizando el uso común muy razonable del término "98% de seguridad", pero debe saber que cada vez que alguien menciona "intervalo de confianza" no es en absoluto lo mismo que un 98% de probabilidad: link.springer.com/article/10.3758%2Fs13423-013-0572-3

19voto

Steve Puntos 212

TL;DR: si p = 1/6 y se quiere saber qué tamaño tiene n necesita tener un 98% de seguridad de que los dados son justos (con una precisión del 2%), n tiene que ser al menos n 766 .


Dejemos que n sea el número de rollos y X el número de tiradas que caen en algún lado especificado. A continuación, X sigue una distribución Binomial(n,p) donde p es la probabilidad de obtener ese lado especificado.

Por el teorema del límite central, sabemos que

n(X/np)N(0,p(1p))

Desde X/n es la media muestral de n Bernoulli (p) variables aleatorias. Por lo tanto, para grandes n , los intervalos de confianza para p puede construirse como

Xn±Zp(1p)n

Desde p es desconocido, podemos sustituirlo por la media de la muestra ˆp=X/n y por varios teoremas de convergencia, sabemos que el intervalo de confianza resultante será asintóticamente válido. Así que obtenemos intervalos de confianza de la forma

ˆp±Zˆp(1ˆp)n

con ˆp=X/n . Voy a suponer que sabes lo que Z -Las puntuaciones son. Por ejemplo, si se quiere un intervalo de confianza del 95%, se toma Z=1.96 . Así que para un nivel de confianza dado α tenemos

ˆp±Zαˆp(1ˆp)n

Ahora digamos que se quiere que este intervalo de confianza tenga una longitud inferior a Cα y quiero saber qué tamaño de muestra necesitamos para hacer este caso. Bueno, esto es equivalente a preguntar qué nα satisface

Zαˆp(1ˆp)nαCα2

Que luego se resuelve para obtener

nα(2ZαCα)2ˆp(1ˆp)

Así que introduzca sus valores para Zα , Cα y estimado ˆp para obtener una estimación de nα . Tenga en cuenta que, dado que p es desconocido esto es sólo una estimación, pero asintóticamente (como n se hace más grande) debería ser preciso.

3 votos

Gracias. Como no he hecho matemáticas de tipo universitario en décadas, ¿podría molestarte para que introduzcas los números y me des un número aproximado de veces que necesitaría lanzar un dado, como un número entero?

9 votos

Si p=1/6 y quiere saber qué tamaño tiene n necesita estar 98% seguro de que los dados son justos dentro de 2%, n tiene que ser al menos n766 . Ignora mi último comentario, utilizado incorrectamente Cα .

1 votos

¡Super, gracias! (Así que las pruebas de 1000 tiradas eran un número razonable para usar, sobre todo cuando se hacen con varios dados cada una. Interesante).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X