Le site distribución binomial es una distribución comúnmente utilizada para modelar experimentos repetidos con un claro éxito/fracaso donde cada ensayo es independiente de otro y cada ensayo tiene la misma probabilidad de éxito. Por ejemplo, al lanzar una moneda injusta $n$ veces y contando el número de cabezas que ve, o seleccionando bolas de una bolsa con sustitución .
Aquí, para nuestro problema, tenemos que suponer que el número de estudiantes que estamos seleccionando es un número "grande" en comparación con $300$ . De este modo, al modelizar el proceso mediante una distribución binomial, podemos obtener una buena estimación de nuestros cálculos de probabilidad, que son exactos con varios decimales de precisión. La idea es que, con tantas personas, la diferencia entre haber seleccionado con sustitución o sin es tan minúsculo que no afecta a nuestra probabilidad de forma significativa.
Dejar $X$ sea la variable aleatoria que cuenta el número de aciertos, la probabilidad de obtener exactamente $k$ éxitos de $n$ ensayos independientes en los que la probabilidad de éxito es $p$ para cada ensayo es:
$$Pr(X=k)=\binom{n}{k}p^k(1-p)^{n-k}$$
Conectando $p=0.2, n=300$ y $k=50$ a lo anterior, obtenemos una respuesta inmediata para (iii) de
$$Pr(X=50)=\binom{300}{50}\cdot 0.2^{50}\cdot (1-0.2)^{300-50}\approx 0.0207557$$
Ahora, para las partes anteriores, si tenemos una calculadora lo suficientemente fuerte, podríamos simplemente hacer un bucle a través de una suma y obtener una respuesta exacta como este pero supongo que la solución prevista es más bien acercarse utilizando el aproximación normal a la binomial .
Es bien sabido que una variable aleatoria con distribución binomial tiene media $np$ y la desviación estándar $\sqrt{np(1-p)}$ por lo que en nuestro caso tenemos una media de $60$ y una desviación estándar de $\sqrt{48}\approx 6.93$ .
Puede aproximar el discreto distribución binomial para valores dados de $n,p$ utilizando el continuo distribución normal con media $np$ y la desviación estándar $\sqrt{np(1-p)}$ las áreas bajo la gráfica de cada uno sobre una región serán muy similares siempre que $n$ y $np(1-p)$ son lo suficientemente grandes. Cuanto más grandes sean, más precisa será la aproximación.
Para continuar, para encontrar la aproximación para $Pr(a\leq X\leq b)$ Primero aplicamos una ligera corrección de continuidad rellenando la distancia fuera de la región que nos interesa para cada límite sumando o restando $\frac{1}{2}$ por lo que en su lugar miramos $Pr(a-\frac{1}{2}\leq X\leq b+\frac{1}{2})$ . Esto, de nuevo, porque la distribución binomial era discreta mientras que la distribución normal es continua. ( Con una desviación estándar lo suficientemente grande, este paso podría incluso saltarse )
A continuación, encontramos "cuántas desviaciones estándar por encima de la media $a-\frac{1}{2}$ y $b+\frac{1}{2}$ son respectivamente ( un valor negativo que corresponde a estar realmente esa cantidad por debajo de la media ). Por medio de un poco de álgebra, encontrarás que son $\dfrac{a-\frac{1}{2}-np}{\sqrt{np(1-p)}}$ y $\dfrac{b+\frac{1}{2}-np}{\sqrt{np(1-p)}}$ respectivamente. ( Puede ver esto en su lugar escrito como $\frac{a-\mu}{\sigma}$ . ) Es común escuchar que se refieran a ellos como " $Z$ -Puntuación" o "Puntuación estándar" .
Ahora que hemos encontrado esos valores, podemos hacer la pregunta para una distribución normal estándar, preguntando cuál es la probabilidad de que se encuentre dentro de ese rango de desviaciones estándar de esos valores. Esto puede hacerse mirando una tabla o utilizando una calculadora.
Cuando utilice una tabla, recuerde que $Pr(m\leq Z\leq n) = Pr(Z\leq n) - Pr(Z< m)$
Para el ejemplo de encontrar la probabilidad entre $20$ y $60$ personas son estudiantes de inglés, nos esforzamos por calcular las puntuaciones z adecuadas, que en este caso son $\approx\dfrac{19.5-60}{6.93}\approx -5.844$ y $\approx\dfrac{60.5-60}{6.93}\approx 0.072$ respectivamente.
Encontrando las probabilidades de estos, se puede buscar en una tabla para encontrar $Pr(Z\leq -5.844)\approx 0.0000$ y $Pr(Z\leq 0.072)\approx 0.5287$ respectivamente, por lo que la probabilidad de estar entre $20$ y $60$ personas es aproximadamente $0.5287$ ( comparar con la respuesta exacta de $\approx 0.534476$ que encontramos antes con el cálculo exacto ). ( compárese también con la respuesta de $0.5$ que habríamos obtenido si no hubiéramos utilizado la corrección de continuidad ).
La otra parte puede calcularse de forma similar.