4 votos

¿Cómo determinar el número de ensayos realizados para una distribución aleatoria uniforme discreta?

Digamos que tengo un dado discreto uniformemente aleatorio que lanza valores en el rango $[min,max]$ . Y digamos que tiro ese dado $N$ veces y registrar la suma total $Sum$ .

Dado $min$ , $max$ y $Sum$ Me gustaría determinar $N$ con cierta certeza.

Así que, por ejemplo, digamos que tiro un dado normal de 6 caras $N$ veces y obtener una suma de 30. Me gustaría saber, con, digamos, un 95% de certeza, un rango de valores que $N$ está dentro.

(No se trata de una pregunta de deberes; me encontré con el problema al escribir esta respuesta y me he dado cuenta de que no tengo ni idea de cómo resolverlo)

1voto

Mahdi Khosravi Puntos 2483

Esta cuestión es una pregunta típicamente conocida en Teoría de la estimación .

Utilizando Estimación por máxima verosimilitud podemos encontrar el valor más probable para $N$ con respecto a $sum$ , $min$ y $max$ .

Sabemos que la distribución de probabilidad para una tirada es $$ P[x_i=n]=\frac1{max-min+1}, \qquad n=min,min+1,\cdots, max $$ y como las tiradas son independientes entre sí, sabemos que la distribución de probabilidad de $y=\sum_{i=1}^N x_i$ es la convolución del pdf de cada $x_i$ . Por lo tanto ella es N veces la convolución de $P[x_i=n]$ por sí misma (o la transformada Z inversa de la transformada Z de $P[x_i=n]$ al poder de $N$ )

En la estimación de máxima verosimilitud buscamos un valor del parámetro de $N$ que maximiza la probabilidad de observar $y = sum$ . Así que el problema es : $$ \max_N f(N)=P(n=sum|N) = \\ \mathcal Z^{-1}\left[\left(\mathcal Z \left[\frac1{max-min+1}\left(\delta(n-min)+\cdots + \delta(n-max)\right)\right]\right)^N\right]\large|_{n=sum} \\ = \left( \frac1{max-min+1} \right)^N\mathcal Z^{-1}\left[\left(z^{-min} + \cdots + z^{-max} \right)^N\right]\large|_{n=sum} $$ donde $\mathcal Z$ y $\mathcal Z^{-1}$ son operadores de transformación Z y de transformación Z inversa, respectivamente.

Ahora todo lo que debes hacer es encontrar $N$ que maximiza $f(N)$ que es tan sencillo como hacer una derivación.

1voto

Justin Walgran Puntos 552

Por tu respuesta a la pregunta del RPG parece que te interesa el caso en que el número de tiradas es relativamente grande, así que voy a hacer algunas aproximaciones.

Esto es básicamente una pregunta en teoría de la renovación . El teorema que desea es el teorema central del límite de renovación - véase por ejemplo "Un teorema central del límite" aquí . La notación es un poco complicada, pero esencialmente:

  • las tiradas se convierten en el "proceso de llegada". Así que tienes $X = (X_1, X_2, \ldots)$ que son todos independientes y están uniformemente distribuidos; en particular, tienen la distribución uniforme discreta en $[a, b]$ Así que $E(X) = (b+a)/2$ y $Var(X) = ((b-a+1)^2-1)/12$ . Para facilitar la notación más adelante, estableceremos $\mu = (b+a)/2$ y $\sigma^2 = ((b-a+1)^2 - 1)/12$ .

  • la "variable de recuento" $N_t$ es el número de tiradas necesarias para alcanzar la suma $t$ .

  • por el CLT de renovación, $N_t$ es aproximadamente normal con media $t/\mu$ y la desviación estándar $\sigma \sqrt{t/\mu^3}$ .

Veamos el caso de su pregunta original. Allí tiene $t = 3393-700 = 2693$ . Los tiempos mínimos y máximos de llegada son $a = 18, b = 30$ Así que $\mu = 24, \sigma = \sqrt{(13^2-1)/12} = \sqrt{14}$ . Por lo tanto, el número medio de generaciones es $2693/24 \approx 112.2$ y la desviación estándar es $\sqrt{14} \sqrt{2693/24^3} \approx 1.65$ por lo que un intervalo de confianza del 95 por ciento sería algo así como $112.2 \pm 3.2$ .

0voto

Hay que describir qué ha hecho que el experimento se detenga en ese resultado.

Si $min, max, N, Sum$ son todos positivos, tal vez alguien estaba apuntando a $Sum$ con la intención de reiniciar el experimento si habían perdido $Sum$ después de $max$ lanzamientos sabiendo que nunca le darían. Entonces podrías calcular la probabilidad de acertar $Sum$ después de un número determinado de pasos, y esto le daría una distribución para $N$ .

Así que en tu ejemplo de un dado justo estándar, tendrías por ejemplo una probabilidad de acertar $Sum=30$ con $N=5$ de $\frac{1}{6^5}$ , una probabilidad de $N=10$ de $\frac{2930455 }{6^{10}}$ y una probabilidad de $N=29$ de $\frac{29}{6^{29}}$ etc. [Este El applet Java cuenta las composiciones Por ejemplo, con "Composiciones de" 30, "Número exacto de términos" 10 y "Cada término no más de" 6, aunque hay otros enfoques]. Si se suman las probabilidades, se obtiene un resultado aproximado de $0.28569$ por lo que hay que dividir cada una de ellas por esto para obtener una distribución con una probabilidad total de $1$ .

Verá que la media es de aproximadamente $8.81$ la mediana $9$ y el modo $8$ . No habrías estado muy lejos con la aproximación más simple $\frac{Sum}{(min+max)/2}$ que en este caso se trata de $8.57$ . Los intervalos $[6,11]$ y $[7,12]$ cada uno cubre algo más del 95% de la probabilidad.

0voto

Hipponax43 Puntos 163

He escrito una solución a mano, espero que no te moleste mucho.

ANSWER

0voto

rummi Puntos 13

Bueno, si dejas que $S=X_1+X_2+...+X_N$ donde $X_1,...,X_N$ son variables aleatorias que representan cada tirada de dados, entonces mgf de S es

$M(t)=\frac{1}{6^N}(e^t+e^{2t}+...+e^{6t})^N$ así que $P(S=s \, and \, N=n)$ es el coeficiente de $e^{st}$ en esto que se puede encontrar una fórmula para.

Podrías modelar $N$ como

$P(N=n/S=s)=P(S=s \, and \, N=n)/P(S=s)$

una v.r. condicional esto sería posible sólo suma P(S=s) a través de todos los valores de N que podrían dar esa suma. A continuación, encuentre el valor esperado y la probabilidad de n(s) en torno a él hasta que se acerque a 0,95. Esto sólo es realmente práctico con un ordenador, pero la respuesta será exacta y no una aproximación.

Por ejemplo, para $s=4$ $N$ puede ser $1$ a $4$ y haciendo los cálculos anteriores se obtiene $P(N=1)=.629$ , $P(N=2)=.314$ , $P(N=3)=.0524$ y $P(N=4)=.002915$ para que puedas estar seguro al 95% de que has rodado una o dos veces.

Todo esto se hizo con un dado de 6 caras, pero sólo tienes que cambiar el mgf para un dado diferente, esto funcionará incluso para los números negativos en un dado o dados no idénticos ... el mgf para el máximo, el mínimo sería $M(t)=\frac{1}{(max-min)^N}(e^{min*t}+e^{(min+1)t}+...+e^{max*t})^N$ y todo es igual.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X