5 votos

Cómo configurar la aproximación normal para binomial

En una escuela particular, el 25% de los estudiantes de primer grado no disfrutan la lectura. El 22% de los estudiantes de segundo grado tampoco disfrutan la lectura. Se toma una muestra aleatoria de 100 estudiantes de primer grado, y otra muestra independiente de 100 estudiantes de segundo grado.

Parte 1: Usa la aproximación normal para encontrar la probabilidad de que menos de 30 estudiantes de primer grado en la muestra no disfruten la lectura.

Parte 2: Usa la aproximación normal para encontrar la probabilidad de que 5 estudiantes de segundo grado más que de primer grado en las muestras no disfruten la lectura.

Para la parte 1, después de hacer la corrección de 0.5, obtuve $$ O \ sigue \ N(25, 18.75) $$ $$ P(O \le 29.5) = 0.851 $$

¿Es correcto? Y para la parte 2, no estoy seguro de cómo configurarlo.

¡Gracias!

1 votos

El autor tiene el método y la respuesta correcta. Esta pregunta ha sido bien recibida (posiblemente, en parte, porque la Parte 2 no es un problema rutinario). Debido a los 'votos positivos', he explicado el método para ambas partes con cierto detalle, colocando cada Parte en una Respuesta separada.

1voto

BruceET Puntos 7117

Parte 1: p = .25 de los estudiantes de primer grado no disfrutan de la lectura; n = 100 estudiantes de primer grado seleccionados al azar; X = número de 100 que no disfrutan de la lectura. Buscamos $P\{X < 30\} = P\{X \leq 29\}.$ Usando el software R, la probabilidad exacta se da por 'pbinom(29, 100, .25)' que devuelve 0.850459.

¿Cómo se puede aproximar esta probabilidad usando la distribución normal? (Primeramente n es suficientemente grande y p es bastante lejos de 0 (y 1) para que tal aproximación sea factible.) $E(X) = np = 100(.25) = 25$ y $V(X) = np(1-p) = 18.75.$ Entonces $$ P\{X \le 29.5\} = P\{(X - 25)/\sqrt{18.75} < (29.5 = 25)/\sqrt{18.75} = 1.039\} \approx P\{Z \le 1.039\} = 0.8506.$$ La variable aleatoria binomial 'estandarizada' $(X - 25)/\sqrt{18.75}$ es aproximada por la variable aleatoria normal estándar $Z$. (Observa el símbolo de 'aproximadamente igual' $\approx$ en el punto apropiado.)

Observa que para la variable aleatoria discreta X la probabilidad deseada puede expresarse como $P\{X < 30\}$ o $P\{X \leq 29\}$. Cuando se aproxima por la variable aleatoria normal continua, generalmente se obtiene una mejor aproximación usando un límite en 29.5 a la mitad.

La probabilidad normal aproximada se puede encontrar con software o usando tablas impresas de la distribución normal estándar. (En el último caso probablemente tendrías que usar 1.04 en lugar de 1.039, nosotros usamos software así que tu respuesta podría ser ligeramente diferente.)

Observa que el resultado 0.8506 no está lejos del resultado exacto 0.850495. Como aquí, las aproximaciones normales comúnmente dan una precisión de dos decimales.

1voto

BruceET Puntos 7117

Parte 2: Para estudiantes de segundo grado, p = .22, n = 100, y Y es el número de estudiantes muestreados que no disfrutan la lectura. Al igual que en la Parte 1, obtenemos $E(Y) = 22$ y $V(Y) = 17.16.

También necesitamos la media y la varianza de $W = Y - X$, con $X$ como en la Parte 1. Tenemos $E(W) = E(Y-X) = 22 - 25 = -3$ y $V(W) = 18.75 + 17.16 = 36.91 (nota que las varianzas SE SUMAN), por lo que la desviación estándar de la diferencia es 5.9924. Buscamos

$$P\{W = 5\} = P\{4.5 \le W \le 5.5\} \approx P\{(4.5 + 3)/5.9924 \le Z \le (5.5+3)/5.9924\} = P\{1.252 \le Z \le 1.418\} = 0.027.$$

En la Parte 1, algunos autores pueden haber ignorado la "corrección de continuidad" que utiliza los enteros medianos en los límites. Aquí, sin embargo, esta corrección es esencial para obtener una respuesta sensata.

Al igual que en la Parte 1, es posible que obtengas una respuesta ligeramente diferente usando tablas impresas de la distribución normal estándar, redondeando los límites a dos decimales, que lo que obtuvimos con el software. En R, la instrucción 'diff(pnorm(c(1.252, 1.418))' devuelve 0.02719.

Una simulación de un millón de ejecuciones de este experimento de 200 estudiantes arrojó la misma respuesta de 0.027 a tres lugares que en la aproximación. Un histograma de las diferencias de un millón de estudiantes reacios a la lectura se asemeja estrechamente a una curva normal con media -3 y desviación estándar 5.9924. (Hubiera sido posible obtener una respuesta exacta, pero no lo hicimos. Puede que quieras reflexionar sobre cuántas probabilidades binomiales tendrías que calcular para hacer eso.)

1 votos

¡Esto es increíble! Muchas gracias por tu respuesta educativa, reflexiva y muy útil. Sinceramente siento que ahora entiendo todo mucho mejor.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X