29 votos

Estadísticas de concepto para explicar por qué es menos probable para voltear el mismo número de cabezas de las colas, como el número de lanzamientos aumenta?

Estoy trabajando en el aprendizaje de la probabilidad y de la estadística mediante la lectura de un par de libros y a escribir algo de código, y durante la simulación de la moneda para decidir noté algo que me llamó la atención como ligeramente contra uno es ingenuo intuición. Si usted lanza una moneda $$ n veces, la proporción de cabezas de las colas converge hacia 1 $$ n aumenta, exactamente como cabría esperar. Pero, por otro lado, como $n$ aumenta, parece que queda menos probable que a la vuelta el mismo número de cabezas de las colas, por lo tanto, obtener una relación de exactamente 1.

Por ejemplo (algunas de salida de mi programa)

For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)

Mi pregunta es esta: ¿hay un concepto / principio de estadística / probabilidad, la teoría que explica esto? Si es así, ¿qué principio o concepto es?

Enlace a código por si alguien está interesado en ver cómo me genera esto.

-- edit --

Para lo que vale, esto es lo que yo estaba explicando esto a mí mismo antes. Si usted lanza una moneda de $\mathtt$ n veces y se cuenta el número de caras, básicamente lo que hace es generar un número aleatorio. Del mismo modo, si usted hace lo mismo y el recuento de las colas, también la generación de un número aleatorio. Así que si usted cuenta tanto, usted está realmente generar dos números aleatorios, y como $\mathtt$ n se hace más grande, los números aleatorios son cada vez más grandes. Y el mayor de los números aleatorios se generan, más posibilidades hay para ellos "perder" unos a otros. Lo que hace este interesante es que los dos números son realmente vinculado en un sentido, con su relación de converger hacia uno a medida que van creciendo, a pesar de que cada número es aleatorio en el aislamiento. Tal vez sea sólo yo, pero me parece que ese tipo de ordenadas.

31voto

AdamSane Puntos 1825

Tenga en cuenta que el caso de que el número de caras y el número de colas son iguales, es el mismo como "exactamente la mitad de la cabeza". Así que vamos a ponerle a contar el número de cabezas para ver si es la mitad el número de lanzamientos o, equivalentemente, la comparación de la proporción de la cabeza con 0.5.

El más flip, el más grande es el número de posibles cargos de jefes puede -- la distribución se vuelve más extendido (por ejemplo, un intervalo para el número de cabezas que contiene el 95% de la probabilidad de crecer a medida que el número de lanzamientos aumenta), por lo que la probabilidad de que exactamente la mitad de los jefes tienden a ir hacia abajo como se lanza más.

En consecuencia, la proporción de jefes tendrá más valores posibles; ver aquí, donde vamos a pasar de 100 lanzamientos de 200 lanzamientos:

enter image description here

Con 100 lanzamientos, podemos observar una proporción de 0,49 jefes o 0.50 jefes o 0,51 cabezas (y así sucesivamente-pero nada entre esos valores), pero con 200 tiros, podemos observar 0.49 o 0.495 o 0.50 o 0.505 o 0.510 - la probabilidad que tiene más valores para "cubrir" y para que cada uno tiende a obtener una parte más pequeña.

Considere la posibilidad de que usted tiene $2n$ tiros con una cierta probabilidad de $p_i$ de $i$ cabezas (sabemos que estas probabilidades, pero no es crítico para esta parte), y se añaden dos más lanzamientos. En $2n$ lanzamientos, $n$ cabezas es el resultado más probable ($p_n>p_{n\pm 1}$ y se va de ahí para abajo).

¿Cuál es la probabilidad de tener $n+1$ cabezas en $2n+2$ lanzamientos?

(Etiqueta de estas probabilidades con $q$, así que no confundir con los anteriores; también sea P(HH) la probabilidad de "de la Cabeza,de la Cabeza" en los dos próximos lanzamientos, y así sucesivamente)

$q_{n+1} = p_{n-1} P(HH) + p_n (P(HT)+P(T)) + p_{n+1} P(TT)$

$\qquad < p_{n} P(HH) + p_n (P(HT)+P(T)) + p_{n} P(TT) = p_n$

es decir, si se agregan dos más monedas arrojadas, la probabilidad de que el valor del medio natural que va hacia abajo, debido a que el promedio es el más probable (en el medio) valor con el promedio de los valores pequeños en cada lado)

Así que, mientras usted esté seguro de que el pico en el medio (por $2n= 2,4,6,...$), la probabilidad de que exactamente la mitad de los jefes deben disminuir como $n de$ va.


De hecho, podemos mostrar que para grandes $n$, $p_n$ disminuye proporcionalmente con $\frac{1}{\sqrt{n}}$ (como era de esperar, ya que la distribución de la normalizado número de cabezas de los enfoques de la normalidad y la varianza de la proporción de jefes disminuye con $n$).


Conforme a lo solicitado, aquí la R de código que produce algo parecido a la anterior parcela:

 x1 = 25:75
 x2 = 50:150
 plot(x1 / 100, dbinom(x1, 100, 0.5), type = "h",
       main = "Proportion of heads in 100 and 200 tosses",
       xlab = "Proportion of heads",
       ylab = "probability")
 points(x2 / 200, dbinom(x2, 200, 0.5), type = "h", col = 3)

5voto

Alex Dupuy Puntos 171

Véase el Triángulo de Pascal.

La probabilidad de coin flip resultados se representan con los números a lo largo de la fila inferior. El resultado de la igualdad de cabezas y colas es el número del medio. A medida que el árbol crece más grande (es decir, más volteretas), el número del medio se convierte en una pequeña proporción de la suma de la fila inferior.

1voto

Karl Puntos 162

Tal vez ayuda a esquema que esto está relacionado con el arcoseno de la ley. Se dice que para una ruta de acceso de los resultados de la probabilidad de que la ruta de acceso permanece por más tiempo en el positivo o negativo de dominio es mucho mayor que el que va arriba y abajo de lo que usted espera de la intuición. Aquí algunos enlaces:

http://www.math.unl.edu/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/ExcessHeads/excessheads.shtml

https://en.wikipedia.org/wiki/Arcsine_law

0voto

Crimson Puntos 189

Bien, una cosa a tener en cuenta es que con un número par de flips (de lo contrario, la probabilidad de que la igualdad de cabezas y colas de flips es, por supuesto, exactamente cero), la más probable, el resultado siempre será el uno con exactamente el número de cabezas de volteretas como colas de volteretas.

La distribución de $n$ voltea está dada por los coeficientes del polinomio $$\bigl(\frac{1+x}2\bigr)^n\qquad .$$ Así que, incluso para $n$, la probabilidad es $$p_n = 2^{-n}{n \elegir n/2}\qquad .$$

Usando la aproximación de Stirling para $n!$, llegar a algo como $$p \approx\frac1{\sqrt{\pi n/2}}$$ para la probabilidad de exactamente $n/2$ cabezas (y en consecuencia colas) voltea para $n$ total de lanzamientos. Así que la probabilidad absoluta de este resultado converge a 0, pero mucho más lento que la mayoría de los otros resultados, con los casos extremos de 0 cabezas (o, alternativamente, 0 colas) invierte $2^{n}$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X