4 votos

El paseo aleatorio en caso multinomial

Modelo:

Un vector $X=(X_1, X_2, X_3)$ que sigue un trinomio de distribución con parámetros de $p=1/3$$n$.

(Tengo una moneda con tres lados $S1$, $S2$, $S3$). Le doy la vuelta a la moneda de $n$ veces. La moneda tiene una probabilidad de $p=1/3$ a ser de vuelta para el lado de la $S1$, y del mismo modo con $S2$ y $S3$. $X_1$ cuenta el número de veces que la moneda se voltea para $S1$ ($X_2$ y $X_3$ se definen de manera similar).

Preguntas:

  1. Deje $0 \leq \alpha \leq n$. Quiero encontrar a $T(\alpha)= P (((X_1 - X_2) \geq \alpha) \cap ((X_1 - X_3) \geq \alpha))$, o un límite inferior en $T(\alpha)$
  2. Para qué valores de a $\alpha$, El límite inferior en $T(\alpha)$ no depende de $n$ (es una constante) ?

Si $X$ estaba siguiendo una distribución binomial, el problema hubiera sido fácil de resolver con el paseo aleatorio, pero no sé cómo resolverlo en el multidimensional caso.

Alguna idea? Gracias.

Caso bidimensional

$X= (X_1, X_2)$ sigue una distribución binomial con parámetros de $p=1/2$$n$.

(Una moneda se lanza al $n$ veces. la moneda es con probabilidad de $p=1/2$ y hacia abajo con una probabilidad de $p$. $X_1$ cuenta el número de ups y $X_2$ cuenta el número de bajadas)

Deje $Y= X_1 - X_2$ (Tenemos $n$ coin flips, cuando la moneda está de vuelta, hemos de añadir (+1) a $Y$, cuando la moneda está volteada hacia abajo, añadimos (-1) a $Y$). Podemos ver esto como un paseo aleatorio, cuando la moneda es que hasta vamos a la derecha y cuando está bajando, vamos a la izquierda.

$\mathrm{Var}(Y)=n = \sqrt n ^2 $. $E(Y)=0$

Por el Teorema Central del Límite, $P(Y \geq \alpha) \approx 1 - \Phi(\alpha / \sqrt n)$ (distribución normal).

58voto

giulio Puntos 166

Las probabilidades para este problema puede ser calculado de forma explícita para bastante grande $n$.
Para obtener una aproximación muy buena para incluso moderadamente grande $n$, podemos utilizar el multivariante teorema del límite central.

Definir $U_1 = X_1 - X_2$$U_2 = X_1 - X_3$. Tenga en cuenta que por la simetría, $$ \newcommand{\e}{\mathbb{E}}\renewcommand{\Pr}{\mathbb{Pr}}\newcommand{\Cov}{\mathrm{Cov}}\e U_1 = \e U_2 = 0 \> . $$ También tenemos, por el bilinearity de la covarianza del operador, que $$ \Cov(U_1, U_2) = \Cov(X_1,X_1) - \Cov(X_1,X_3) - \Cov(X_1,X_2) + \Cov(X_2,X_3) \>. $$ Ahora, $\Cov(X_1,X_1) = n p (1-p)$ donde $p = 1/3$ aquí. Un poco más difícil el cálculo de los rendimientos de $$ \Cov(X_1,X_2) = - n p^2 \>, $$ y, por supuesto, por la simetría de nuevo, $\Cov(X_1,X_2) = \Cov(X_1,X_3) = \Cov(X_2,X_3)$.

Por lo tanto, $\Cov(U_1, U_2) = n p (1-p) + n p^2 = np = n/3$ y similar a la de cálculo, $\Cov(U_1, U_1) = \Cov(U_2,U_2) = 2 n p = 2 n / 3$.

Observar que $U_1$ $U_2$ son cada una de las sumas de los independientes e idénticamente distribuidas variables aleatorias. Por ejemplo, si $\xi_i \in \{1,2,3\}$ es el resultado de la $i$th dibujar, a continuación, $U_1 = \sum_{i=1}^n 1_{(\xi_i = 1)} - 1_{(\xi_i = 2)}$ donde $1_{(\cdot)}$ es el indicador de la función.

Por lo tanto, por el multivariante teorema del límite central, llegamos a la conclusión de que $$ \sqrt{\frac{3}{n}} (U_1,U_2) \xrightarrow{d} \mathcal{N}(0, \Sigma) $$ donde $$ \Sigma = \left(\begin{array}{cc}2 & 1 \\ 1 & 2\end{array}\right). $$

Ahora, ya $$ T(\alpha) = \Pr( \{X_1 - X_2 \geq \alpha \} \cap \{X_1 - X_3 \geq \alpha \} ) = \Pr( U_1 \geq \alpha, U_2 \geq \alpha) $$ entonces, podemos aproximar $T(\alpha)$ como sigue $$ T(\alpha) \approx \int_{\alpha\sqrt{3/n}}^\infty \int_{\alpha\sqrt{3/n}}^\infty \frac{1}{2 \sqrt{3} \pi} e^{-\frac{1}{3}(u_1^2 - u_1 u_2 + u_2^2 )} \mathrm{d}u_1 \mathrm{d}u_2 \> . $$

Below is some very brief $R$ code that compares a simulation of the true process against a simulation using the normal approximation assuming $n = 100$ subyacente trinomio ensayos.
En primer lugar, la imagen.

Comparison of actual process and normal approximation via simulation

Aquí está el código.

set.seed(.Random.seed[1])
n <- 100
N <- 10000

X   <- matrix( sample(1:3, n*N, replace=T), nc=n )
xt  <- apply(X,1,table)
dxt <- cbind( xt[1,]-xt[2,], xt[1,]-xt[3,] )
xtt <- table(apply(dxt,1,min))

L   <- matrix( c(sqrt(2), 1/sqrt(2), 0, sqrt(3/2)), 2 )
Y   <- L %*% matrix( rnorm( 2*N ), nr=2 ) * sqrt(n) / sqrt(3)
ytt <- table( floor(apply(Y,2,min)) )

plot( names(xtt), xtt/N, type="h", xlab="a", ylab="Density of T(a)" )
lines( names(ytt), ytt/N, col="red", type="h" )
legend( "topright", legend=c("actual", "normal approx."), lty="solid",
        col=c("black", "red"), bg="white", inset=0.02 )

También hay paquetes de R para calcular normal bivariante de las densidades y de las probabilidades. Ambos mnormt y fMultivar son algunos ejemplos, pero no sé lo suficiente como para recomendar uno sobre otro.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X