6 votos

Distribución de número de ensayos antes de una suma fija se alcanza

Estoy tratando de averiguar la distribución a través de un número de ensayos hasta que una condición de parada se cumple. En particular, imaginar que estamos observando muestras de una variable aleatoria uniformemente distribuida, $X \in \{a,a+1,...,b\}$. Continuamos observando las muestras hasta que la suma de estos números se pasa de un cierto umbral $Z$ a continuación, nos detendremos en el proceso. Es decir, tenemos el conjunto de $\{x_1, ..., x_T | \sum_{i=1}^T x_i \geq Z\}$. Estoy interesado en la distribución de la variable aleatoria $T$ (el número de ensayos).

Esto es similar a una distribución multinomial, o un negativo multinomial, pero no el mismo.

Suponiendo que $b << Z$, podemos pasar por alto el pequeño error de redondeo a la derecha en el extremo de suponer que $\sum_{i=1}^T x_i = Z$. A continuación, podemos hacer algunas observaciones básicas, como $\frac{Z}{a} \leq T \leq \frac{Z}{b}$. También, a partir de experimentos parece que $\mathbb{E}[T] = \frac{Z}{\mathbb{E}[X]}$, no estoy seguro acerca de la varianza, aunque, o la forma general de la distribución.

edit: Esta pregunta puede ser contestada en parte por la observación de los siguientes, primero denotar $Y = \sum_{i=1}^N X_i$, que, por supuesto, ha $Y/N \overset{d}{\to} \mathbb{E}[X]$. Naturalmente, para cualquier gran $N$ esperamos que $Y \approx N\mathbb{E}[X]$. De hecho, esto también podría visto de Hoeffding la desigualdad. Así que, por una lo suficientemente grande como $Z$, si queremos restringir $Y=Z$, $Z \approx T\mathbb{E}[X]$ o $T \approx \frac{Z}{\mathbb{E}[X]}$ como he observado.

3voto

RGA Puntos 113

Mi primer paso sería probar esto. Mientras que la escritura de un programa de este tipo que suelen tener una mejor idea de cómo proceder. Aquí es cómo me gustaría escribir en Stata (y Mata):

clear all
set obs 10000

mata
// for 10,000 obs role a 6-sided die 24 times
x = ceil(6*runiform(10000,24))

// compute a running sum for each observation
for(i=1; i <= 10000; i++) {
    x[i,.] = runningsum(x[i,.])
}

// number of roles till running sum passes 24
T = rowsum(x :< 24)

// add that variable to the dataset
idx =st_addvar("byte","T")
st_store(.,idx,T)
end

// look at T:
spikeplot T

enter image description here

tab T
          T |      Freq.     Percent        Cum.
------------+-----------------------------------
          3 |          6        0.06        0.06
          4 |        638        6.38        6.44
          5 |      2,248       22.48       28.92
          6 |      2,976       29.76       58.68
          7 |      2,313       23.13       81.81
          8 |      1,204       12.04       93.85
          9 |        451        4.51       98.36
         10 |        123        1.23       99.59
         11 |         33        0.33       99.92
         12 |          7        0.07       99.99
         13 |          1        0.01      100.00
------------+-----------------------------------
      Total |     10,000      100.00


sum T

    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
           T |     10000      6.3238    1.344966          3         13

De modo que T es un entero, se tiene el mínimo valor de $\lfloor Z/b\rfloor-1$ y un máximo de $\lfloor Z/a \rfloor - 1$. Me gustaría que tomar algunas manageble valores de $a$, $b$ y $Z$ y escriba la probabilidad de cada uno de los posibles valores de T y buscar un patrón.

3voto

farzad Puntos 4180

Sea $X_1,X_2,\dots$ iid $\mathrm{Uniform}\{a,a+1,\dots,b\}$. Encontrar la distribución de $S_n=\mathrm{constant} + X_1+\dots+X_n$ utilizando la información en la página 285 de este documento. Utilizar el Teorema de momento de golpear para encontrar la distribución de los $T=\inf\,\{n\geq 1:S_n=0\}$.

2voto

Jimmy Chandra Puntos 3562

Otra forma interesante de llegar a la misma respuesta es introducir una segunda variable aleatoria $Y$, el cual es definido a través de la siguiente restricción $$ Y = Z - \sum_{i=1}^T X_i . $$ Intuitivamente, para cualquier número fijo de ensayos, $Y$ hará que el resto de la suma necesidad para llegar a $Z$. Podemos ver claramente que $$ \mathbb{E}[Y] = Z - T\mathbb{E}[X] $$ Ajuste de la LHS igual a cero (sin resto), y resolviendo $T$, tenemos $$ T = \frac{Z}{\mathbb{E}[X]} $$ Esto sólo se da el número esperado de ensayos hasta que no queda ningún resto, que está cerca, pero tal vez no es exactamente la misma cosa...

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X