2 votos

Cómo calcular la probabilidad de una muestra bootstrap

La pregunta

Considere las muestras $\{1, 3, 4, 6\}$ de alguna distribución.

a) Para una muestra aleatoria bootstrap, encuentre la probabilidad de que la media sea $1$ .

b) Para una muestra aleatoria bootstrap, encuentre la probabilidad de que el máximo sea $6$ .

c) Para una muestra aleatoria bootstrap, encuentre la probabilidad de que exactamente dos elementos de la muestra sean menores que $2$ .

Mi entendimiento

Acabamos de empezar a aprender el bootstrap en clase y me encontré con esta pregunta. Estoy un poco confundido, ya que siento que esta pregunta es demasiado fácil, ya que la media de cualquier muestra con esos números es siempre $3.5$ por lo que a) es $0$ . El máximo será siempre $6$ por lo que b) es $1$ . Y $2$ de los números no puede ser inferior a $2$ . Así que c) es $0.$

¿Hay algo importante que se me escapa?

1voto

BruceET Puntos 7117

Creo que es una pregunta muy reflexiva, que lleva a entender cómo funciona el bootstrapping. Sus intentos de respuesta no dan exactamente en el blanco, así que aquí está mi intento de aclarar. Dado que el bootstrapping se basa en la simulación, comienzo con los resultados de la simulación antes de mostrar las probabilidades binomiales exactas para cada parte.

Simulación: Una muestra bootstrap tomará cuatro valores al azar con reemplazo del conjunto $\{1,3,4,6\}.$ Vamos a simular muchas re-muestras y ver qué pasa. Con un millón de muestras bootstrap simuladas las probabilidades simuladas deberían ser precisas hasta dos o tres lugares.

(a) La media de cuatro es $1;$ (b) el máximo es $6;$ (c) necesitan exactamente dos $1$ 's.

set.seed(1)
x = c(1,3,4,6)

a = replicate(10^6, mean(sample(x, 4, rep=T)))
mean(a == 1)
[1] 0.003916  # aprx  0.00390625

w = replicate(10^6, max(sample(x, 4, rep=T)))
mean(w == 6)
[1] 0.683426  # aprx 0.6835938

nr.ones = replicate(10^6, sum(sample(x, 4, rep=T)==1))
mean(nr.ones==2)
[1] 0.210837  # aprx 0.2109375

Por tanto, las probabilidades respectivas de las partes (a)-(c) son aproximadamente $0.004, 0.684,$ y $0.211.$

Probabilidades binomiales exactas: Las probabilidades exactas se pueden encontrar utilizando la distribución binomial. Probabilidades exactas calculadas con R, donde dbinom es una PDF binomial y pbinom es una CDF binomial. Puede utilizar fácilmente la fórmula de la PDF binomial apropiada para hacer los cálculos.

(a) Los onces son éxitos. El número de unos en cuatro sorteos es $X_1 = \mathsf{Binom}(n=4, p = 1.4).$ Para que la media sea $1,$ necesitamos a todos. $P(X_1 = 4) = 0.0039.$

dbinom(4, 4, 1/4)
[1] 0.00390625

(b) Los seises son éxitos. Para que el máximo sea $6,$ necesitamos al menos un seis. $X_2 = \mathsf{Binom}(4,1/4),$ $P(X_2 \ge 1) = 0.6836.$

sum(dbinom(1:4, 4, 1/4))
[1] 0.6835938

1 - dbinom(0, 4, 1/4)
[1] 0.6835938

(c) Valores inferiores $2$ son éxitos. Sólo los unos son más pequeños. Así que necesitamos exactamente dos Unos: La probabilidad es $0.2109.$

dbinom(2, 4, 1/4)
[1] 0.2109375

0voto

GarryB Puntos 1

Entiendo que debe tomar una muestra aleatoria, presumiblemente de tamaño 4, de esos cuatro valores con reemplazo. Esto significa que no es necesario que aparezcan todos, en cuyo caso las probabilidades que se piden no serán las que se obtienen de la muestra dada.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X