23 votos

¿Cuántas tiradas necesito para determinar si mis dados son justos?

¿Cuántas veces tengo que tirar un dado de 6 caras para estar seguro de que los resultados son "justos"? ¿Y un dado de 10 o 20 caras?

Tenga en cuenta que voy a tirar manualmente los dados físicos, esto no es sólo un ejercicio de libro de texto. Me gustaría minimizar el tiempo que me lleva realizar este experimento con cada dado :)

Sé que esto depende de mi "nivel de confianza" esperado (¿95%? ¿99%?) Si elijo un 95% de confianza, por ejemplo, ¿implica eso que 1 de cada 20 dados justos fallará esta prueba? ¿O que un solo dado justo fallaría la prueba 1 de cada 20 veces? Si es así, suena bastante alto.

¿Existen técnicas estándar para realizar este tipo de pruebas?

Edición: Está más allá del alcance de la pregunta centrada en las matemáticas que he planteado aquí, pero he explicado más sobre el escenario general de las pruebas en el sitio de estadísticas aquí: https://stats.stackexchange.com/questions/14301/designing-a-test-for-a-psychic-who-says-he-can-influence-dice-rolls/14302#14302

24voto

Michael Hardy Puntos 128804

Lo primero que se me ocurre es una prueba de chi-cuadrado: $$ \sum\frac{(\text{observed} - \text{expected})^2}{\text{expected}} $$ Si tiras el dado $n$ veces, el número "esperado" de veces que se vería un resultado concreto es $n/6$ . Si $n$ es grande, tiene aproximadamente una distribución chi-cuadrado con 5 grados de libertad. Se rechaza la hipótesis nula de equidad si el estadístico de prueba dado anteriormente es grande.

Un 95% de confianza significa que uno de cada veinte dados justos fallará.

Véase también este asombroso análisis realizado por un físico del que quizá sea el experimento más extenso de este tipo jamás realizado: http://bayes.wustl.edu/etj/articles/entropy.concentration.pdf

Un refinamiento adicional de la prueba de chi cuadrado sería observar que cada resultado de una tirada tiene una cara opuesta. Si un resultado es inusualmente alto, la cara opuesta debería ser inusualmente baja. Así, es la diferencia entre las frecuencias de las caras opuestas la que detecta el desequilibrio en el dado. Podrías crear una simulación en una simple hoja de cálculo y encontrar los límites de confianza por Monte Carlo.

10voto

Vincent Puntos 5027

Dices que esto es para una prueba de habilidades paranormales. Así que tienes que preguntar a tu psíquico lo que creen que pueden lograr. Podrían decir una de las siguientes cosas:

Puedo lanzar un seis más a menudo que la casualidad.
Puedo lanzar 1, 2 o 3 con más frecuencia que el azar.
Puedo lanzar un total mayor al esperado.

Lo que ellos digan, póngalo por escrito . Es un psíquico con el que estás tratando.

Ahora tienes que decidir tu nivel de confianza (creo que el 99% es razonable aquí), y dejar que tu vidente elija la duración de la prueba. De lo contrario, podrían alegar que se cansaron (si hubo muchas pruebas), o que no entraron en ritmo (si no las hubo).

Supongamos que afirman ser capaces de lanzar seises. Si el dado es justo, entonces el número de seises en $n$ sigue una distribución binomial, con media $\mu = n/6$ y la varianza $\sigma^2 = 5n/36$ . Para un tamaño suficientemente grande $n$ (que ciertamente debería ser el caso aquí), la distribución binomial se aproxima a la distribución normal, que para una prueba de una cola con un nivel de confianza del 99% da un corte de aproximadamente $\mu + 2.326$ $\sigma$ o $n/6 + 0.867 \sqrt n$ .

Así que ahora puede ofrecer (digamos) las siguientes opciones:

$n = 100: 100/6 + 0.867\times10 = 25$ seis
$n = 400: 400/6 + 0.867\times20 = 84$ seis
$n = 900: 900/6 + 0.867\times30 = 176$ seis

Lo que el vidente decida, póngalo por escrito . Es un psíquico con el que estás tratando.

El psíquico (con probabilidad $99\%$ ) no pasa la prueba, y (con probabilidad $100\%$ ) salen con algo como "Sí, pero ¡mira todos esos cuatros!" o "Nunca pude entender por qué los miércoles no me funcionan ¿qué tal si lo hacemos de nuevo mañana?".

Háganos saber cómo le va.

4voto

RobertF Puntos 111

La prueba de chi-cuadrado mencionada anteriormente es el enfoque correcto. Sin embargo, para estimar el número adecuado de tiradas de dados para comprobar la equidad, hay que decidir:

1) la potencia deseada de su prueba (= probabilidad de detectar correctamente un dado sesgado), y

2) el tamaño del efecto que se desea detectar con confianza.

Un valor estándar para la potencia es el 80%. Los tamaños de efecto típicos para una prueba de chi-cuadrado oscilan entre 0,1 (pequeño) y 0,5 (grande).

Ver esto sitio web para un rápido tutorial sobre la determinación del tamaño de las muestras para una prueba de chi-cuadrado utilizando el lenguaje gratuito R.

Si elegimos un nivel de significación = 0,05, una potencia = 0,80, grados de libertad = # lados - 1 y un tamaño del efecto = 0,5, encontramos los siguientes tamaños de muestra para probar la equidad de los dados de 6, 10 y 20 caras:

6 caras: 52 rollos

10 caras: 63 rollos

20 caras: 83 rollos

2voto

Robert Christie Puntos 7323

Las pruebas estadísticas que comprueban si los datos proceden de una determinada distribución construyen una función de puntos de muestreo $S(x_1, \ldots x_n)$ , llamada estadística. Suponiendo que los datos procedan efectivamente de la supuesta distribución, esta estadística, siendo ella misma una variable aleatoria, sigue cierta distribución $\mathcal{D}_S$ . La prueba consiste en calcular el valor de la estadística en su muestra de datos y verificar que el resultado no es demasiado improbable. Lo que constituye "no demasiado improbable" está controlado por el nivel de confianza.

Obsérvese que incluso cuando las muestras proceden efectivamente de la supuesta distribución, los estadísticos con poca probabilidad pueden caer legítimamente en la cola, dando lugar a un falso negativo.

Cuando los datos de la muestra no proceden de la supuesta distribución, la distribución de los estadísticos es diferente, y el resultado de la prueba es aún menos definitivo.

Así que cuando los dados son realmente justos, y usted consideraría repetir su prueba muchas veces, $95 \%$ nivel de confianza significa que alrededor de $5\% $ se obtendrían falsos negativos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X