17 votos

¿Cuál es la distribución por múltiples caras de los dados, todo a la vez?

Tomar los 5 sólidos Platónicos a partir de un conjunto de Dungeons&Dragons dados. Estos se componen de una de 4 lados 6 lados (convencional), 8-caras, de 12 caras, y 20 caras de los dados. Todos empiezan en el número 1 y el recuento hacia arriba por 1 a su total.

Rollo de todos a la vez, tomar su suma (suma mínima es de 5, max es de 50). Hacerlo varias veces. ¿Cuál es la distribución?

Obviamente, se tiende hacia el extremo más bajo, ya que hay más números más bajos que altos. Pero habrá notables puntos de inflexión en cada límite de la persona muere?

[Edit: al Parecer, lo que parecía obvio no lo es. De acuerdo a uno de los comentaristas, el promedio es de (5+50)/2=27.5. No me esperaba esto. Yo todavía me gustaría ver un gráfico.]

18voto

AdamSane Puntos 1825

Yo no quiero hacerlo de manera algebraica, pero se puede calcular el pmf simplemente suficiente (es sólo de convolución, que es realmente fácil en una hoja de cálculo).

He calculado que estas en una hoja de cálculo*:

i        n(i)   100 p(i)
5         1     0.0022
6         5     0.0109
7        15     0.0326
8        35     0.0760
9        69     0.1497
10      121     0.2626
11      194     0.4210
12      290     0.6293
13      409     0.8876
14      549     1.1914
15      707     1.5343
16      879     1.9076
17     1060     2.3003
18     1244     2.6997
19     1425     3.0924
20     1597     3.4657
21     1755     3.8086
22     1895     4.1124
23     2014     4.3707
24     2110     4.5790
25     2182     4.7352
26     2230     4.8394
27     2254     4.8915
28     2254     4.8915
29     2230     4.8394
30     2182     4.7352
31     2110     4.5790
32     2014     4.3707
33     1895     4.1124
34     1755     3.8086
35     1597     3.4657
36     1425     3.0924
37     1244     2.6997
38     1060     2.3003
39      879     1.9076
40      707     1.5343
41      549     1.1914
42      409     0.8876
43      290     0.6293
44      194     0.4210
45      121     0.2626
46       69     0.1497
47       35     0.0760
48       15     0.0326
49        5     0.0109
50        1     0.0022

Aquí $n(i)$ es el número de maneras de conseguir que cada total $i$; $p(i)$ es la probabilidad de que, donde $p(i) = n(i)/46080$. Los resultados más probables a ocurrir a menos de 5% del tiempo.

El eje es la probabilidad se expresa como un porcentaje. enter image description here

* El método que he utilizado es similar al procedimiento descrito aquí, a pesar de que el exacto mecanismo implicado en la configuración de cambio como la interfaz de usuario de los detalles de cambio (que el post es de aproximadamente 5 años de edad, sin embargo, he actualizado hace aproximadamente un año). Y he usado un paquete diferente esta vez (Yo lo hice en LibreOffice del Calc este momento). Aún así, ese es el quid de la cuestión.

7voto

jws121295 Puntos 36

Así que he hecho este código:

d4 <- 1:4  #the faces on a d4
d6 <- 1:6  #the faces on a d6
d8 <- 1:8  #the faces on a d8
d10 <- 1:10 #the faces on a d10 (not used)
d12 <- 1:12 #the faces on a d12
d20 <- 1:20 #the faces on a d20

N <- 2000000  #run it 2 million times
mysum <- numeric(length = N)

for (i in 1:N){
     mysum[i] <- sample(d4,1)+
                 sample(d6,1)+
                 sample(d8,1)+
                 sample(d12,1)+
                 sample(d20,1)
}

#make the plot
hist(mysum,breaks = 1000,freq = FALSE,ylim=c(0,1))
grid()

El resultado es este de la parcela. enter image description here

Es muy Gaussiano buscando. Creo que (de nuevo) de mayo han demostrado una variación en el teorema del límite central.

7voto

kjetil b halvorsen Puntos 7012

Voy a mostrar un enfoque para hacer esto de manera algebraica, con la ayuda de R. Asumir las distintas dados tienen distribuciones de probabilidad dada por los vectores $$ P(X=i)=p(i) $$ where $X$ is the number of eyes seen on throwing the dice, and $i$ is a integer in the range $0,1,\dots,n$. So the probability of two eyes, say, is in the third vector component. Then a standard dice has distribution given by the vector $(0,1/6,1/6,1/6,1/6,1/6,1/6)$. The probability generating function (pgf) is then given by $p(t)=\sum_0^6 p(i) t^i$. Let the second dice have distribution given by the vector $q(j)$ with $j$ in range $0,1,\dots,m$. Then the distribution of the sum of eyes on two independent dice rolls given by the product of the pgf' s, $p(t)q(t)$. La escritura de thet producto podemos ver que es dado por la convolución de la coeficiente de secuencias, por lo que se puede encontrar por la R de la función de convolución(). Vamos a probar esto por dos tiros de la norma dice:

> p  <-  q  <-  c(0, rep(1/6,6))
> pq  <-  convolve(p,rev(q),type="open")
> zapsmall(pq)
 [1] 0.00000000 0.00000000 0.02777778 0.05555556 0.08333333 0.11111111
 [7] 0.13888889 0.16666667 0.13888889 0.11111111 0.08333333 0.05555556
[13] 0.02777778

y se puede comprobar que es correcto (por mano de cálculo). Ahora a por la pregunta, cinco dados con 4,6,8,12,20 lados. Voy a hacer el cálculo suponiendo uniforme probs para cada uno de los dados. Entonces:

> p1  <-  c(0,rep(1/4,4))
> p2 <-  c(0,rep(1/6,6))
> p3 <-  c(0,rep(1/8,8))
> p4  <-  c(0, rep(1/12,12))
> p5  <-  c(0, rep(1/20,20))
> s2  <-  convolve(p1,rev(p2),type="open")
> s3 <-  convolve(s2,rev(p3),type="open")
> s4 <-  convolve(s3,rev(p4),type="open")
> s5 <- convolve(s4, rev(p5), type="open")
> sum(s5)
[1] 1
> zapsmall(s5)
 [1] 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000 0.00002170
 [7] 0.00010851 0.00032552 0.00075955 0.00149740 0.00262587 0.00421007
[13] 0.00629340 0.00887587 0.01191406 0.01534288 0.01907552 0.02300347
[19] 0.02699653 0.03092448 0.03465712 0.03808594 0.04112413 0.04370660
[25] 0.04578993 0.04735243 0.04839410 0.04891493 0.04891493 0.04839410
[31] 0.04735243 0.04578993 0.04370660 0.04112413 0.03808594 0.03465712
[37] 0.03092448 0.02699653 0.02300347 0.01907552 0.01534288 0.01191406
[43] 0.00887587 0.00629340 0.00421007 0.00262587 0.00149740 0.00075955
[49] 0.00032552 0.00010851 0.00002170
> plot(0:50,zapsmall(s5))

La trama se muestra a continuación:

enter image description here

Ahora usted puede comparar esta solución exacta con las simulaciones.

6voto

lyxera Puntos 975

Un poco de ayuda de su intuición:

En primer lugar, piense en lo que sucede si se agrega una a todas las caras de un dado, por ejemplo, la d4. Así, en lugar de 1,2,3,4, los rostros muestran ahora 2,3,4,5.

Comparando esta situación con la de la original, es fácil ver que la suma total es ahora uno de los más altos de lo que solía ser. Esto significa que la forma de la distribución es igual que antes, se acaba de mudar un paso al costado.

Ahora resta el valor promedio de cada uno de los troqueles de cada lado de los que mueren.

Esto le da a los dados marcados

  • $-{3\over 2}$,$-{1\over 2}$,${1\over 2}$,${3\over 2}$
  • $-{5\over 2}$,$-{3\over 2}$,$-{1\over 2}$,${1\over 2}$,${3\over 2}$,${5\over 2}$
  • $-{7\over 2}$,$-{5\over 2}$,$-{3\over 2}$,$-{1\over 2}$,${1\over 2}$,${3\over 2}$,${5\over 2}$,${7\over 2}$

etc.

Ahora, la suma de estos dados todavía debe tener la misma forma que el original, sólo se desplaza hacia abajo. Debe quedar claro que esta suma es simétrica alrededor de cero. Por lo tanto, la distribución original, también es simétrica.

1voto

VanHackman Puntos 36

El Teorema del Límite Central responde a su pregunta. A pesar de sus detalles y su prueba (y que el artículo de la Wikipedia) son algo de flexión de cerebro, el quid de la cuestión es simple. Por la Wikipedia, los estados que

la suma de un número de independientes e idénticamente distribuidas variables aleatorias con finito desviaciones tienden a una distribución normal a medida que el número de variables crece.

Bosquejo de una prueba para su caso:

Cuando dices "el rollo de que todos los dados a la vez," cada rollo de todos los dados es una variable aleatoria.

Los dados han finito de números impresos en ellos. La suma de sus valores, por tanto, tiene varianza finita.

Cada vez que sacas todos los dados, la distribución de la probabilidad de que el resultado es el mismo. (Los dados no cambian entre los rollos.)

Si usted hace rodar los dados bastante, cada vez que el rollo de ellos, el resultado es independiente. (Anterior rollos de no afectar el futuro de los rollos.)

Independiente? De verificación. Idénticamente distribuidas? De verificación. Varianza finita? De verificación. Por lo tanto, la suma tiende a una distribución normal.

Ni siquiera importa si la distribución de un rollo de los dados fueron desequilibrado hacia el extremo inferior. No me importa si no se cúspides en esa distribución. Todos los que la suma se suaviza y hace que sea simétrica de gauss. Usted incluso no necesita hacer ninguna de álgebra o de simulación para mostrar! Esa es la sorprendente visión de la CLT.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X