2 votos

Pregunta de distribución de muestreo

Necesito aclaración sobre un ejemplo de muestra binomial:

tomamos una muestra de tamaño $100$ de una distribución binomial($m = 2$,$p = 0.2$) y observamos $76$ de los $x_i = 0$, $20$ de los $x_i = 1$ y $4$ de los $x_i = 2$

ahora a medida que $n$ la distribución empírica se parecerá más y más a la binomial$(2,0.2)$ de la que se extrajo (¿por qué?).

Supongo que esto es debido a la Ley de los Grandes Números (no estoy seguro si Ley de los Grandes Números Debiles o Fuertes). ¿La media y la varianza de la distribución empírica se acercarán a la media y varianza de la binomial??

mis notas de clase tienen la siguiente explicación:

Por ejemplo, si $X_i$ sigue una distribución $Binom(2, 0.2)$ entonces para $n = 100$,

$$ P \bigg( \frac{1}{n} \sum_{i=1}^{n} 1_{[X_i=0]} \geq 0.76 \bigg) \simeq 0.007 $$ pero para $n = 1000$ $$ P \bigg( \frac{1}{n} \sum_{i=1}^{n} 1_{[X_i=0]} \geq 0.76 \bigg) \simeq 2.3\times(10^{-16}) $$

Entiendo el LHS en la función de probabilidad, que es la proporción total de $x_i = 0$, pero no entiendo por qué el RHS es $0.76$, ¿no debería ser $0.64$ (que es la probabilidad de $x_i = 0$, desde el código R dbinom(0,2,0.2)).

0 votos

¿Cómo se obtiene 0.64? ¿Qué es 'dbinom(0,2,0.2)'?

1 votos

Esa es la probabilidad de x=0, con m=2 y p=0.2, `dbinom(0, 2, 0.2)` es el comando de R que proporciona la probabilidad.

1voto

BruceET Puntos 7117

En el experimento inicial con $n=100$ realizaciones de $X \sim Binom(2, .2)$ obtuviste $X = 0$ 76 veces, lo cual es mayor que las 64 ocurrencias esperadas.

 dbinom(0, 2, .2)
 ## 0.64

Este es un resultado algo sorprendente porque la probabilidad de obtener 76 o más 0's es solo 0.007, como muestra tu primera ecuación. (Un cálculo ligeramente diferente de binomial verifica esta afirmación.)

 1 - pbinom(75, 100, .64)
 ## 0.007013119

La pregunta es si experimentos con números cada vez más grandes $n$ de realizaciones de $X \sim Binom(2, .2)$ continuarán con números excesivos de 0's. Así que verificamos qué podríamos esperar para $n = 1000$ realizaciones. La respuesta es que este grado de desviación de lo esperado es entonces muy improbable, como se afirma en la segunda ecuación mostrada.

 1 - pbinom(759, 1000, .64)
 ## 2.220446e-16

La ley débil de grandes números impide que este tipo de 'mal comportamiento' persista a medida que $n \rightarrow \infty.

Quizás una imagen ayudará a mostrar la ley débil de grandes números en acción. Para $n = 1, 2, \dots 10,000$ la línea entre las regiones azul claro y oscuro muestra el promedio móvil de instancias con 0's (terminando muy cerca de 0.64); la línea entre azul claro y blanco muestra los promedios móviles con 0's o 1's (terminando muy cerca de 0.96).

introducir descripción de la imagen aquí

El código de R a continuación (poco elegante, pero simple y correcto) muestra cómo se hizo el gráfico.

 n = 10^4;  x = numeric(n)
 for(i in 1:n) { x[i] = rbinom(1, 2, .2) }
 trace.0 = cumsum(x==0)/(1:n)
 trace.01 = cumsum(x<=1)/(1:n)
 plot(trace.01, type="h", ylim=c(0,1), col="skyblue", ylab="Promedio Móvil") 
 lines(trace.0, type="h", col="blue")
 abline(h = .64, col="red");  abline(h=.96, col="red")

0 votos

¡Gracias BruceET, excelente exposición!

0 votos

No estoy seguro todavía acerca de la distinción entre WLLN y SLLN. Esto es lo que leo en la imagen, en n cercano a 10000, el promedio de ejecuciones con 0's está ligeramente por encima de 0.64, por lo que es posible obtener una mayor proporción de 0's como se confirma arriba $P(X > 760) > 0$: Basado en lo que leí en el Primer curso en Prob de S. Ross, SLLN afirma que este comportamiento solo ocurre un número finito de veces para n muy grande, mientras que WLLN afirma que esto puede ocurrir infinitas veces para n grande. ¿Es esto correcto?

0 votos

Let $X_1, X_2, \dots$ sea una secuencia de RV 'convergiendo' a $X$. WLLN dice, $P(|X_i - X| < \epsilon) \rightarrow 1$, para cualquier $\epsilon > 0.$ SLLN dice $P(\omega: X_i(\omega) \rightarrow X(\omega)) = 1.$ A grosso modo, en el primero, podría haber intervalos donde $X_i$ no converge a $X$. Busca un libro o sitio con un ejemplo donde WLLN se cumple y SLLN no.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X