1 votos

Ayuda a la probabilidad estadística - probabilidad aproximada de que # estudiantes menores de edad en inglés

El porcentaje de estudiantes de Artes (aparte de los estudiantes de Teatro e Inglés) que hacen un minor en inglés es del 20%. Si se seleccionan 300 estudiantes, ¿cuál es la probabilidad aproximada de que:

i. ¿más de 150 están cursando un minor en inglés?

ii. ¿entre 20 y 60 están cursando una licenciatura en inglés?

iii. ¿exactamente 50 están cursando un minor en inglés?

Ya hice esta pregunta antes, pero la persona que me respondió me dio i) 0, ii) 0,50 y iii) 0,0203. No proporcionaron ningún paso, y por más que lo intenté, no pude averiguar cómo obtuvieron esos valores. Agradecería mucho si alguien pudiera explicar paso a paso cómo se obtienen esos valores.

0voto

JMoravitz Puntos 14532

Le site distribución binomial es una distribución comúnmente utilizada para modelar experimentos repetidos con un claro éxito/fracaso donde cada ensayo es independiente de otro y cada ensayo tiene la misma probabilidad de éxito. Por ejemplo, al lanzar una moneda injusta $n$ veces y contando el número de cabezas que ve, o seleccionando bolas de una bolsa con sustitución .

Aquí, para nuestro problema, tenemos que suponer que el número de estudiantes que estamos seleccionando es un número "grande" en comparación con $300$ . De este modo, al modelizar el proceso mediante una distribución binomial, podemos obtener una buena estimación de nuestros cálculos de probabilidad, que son exactos con varios decimales de precisión. La idea es que, con tantas personas, la diferencia entre haber seleccionado con sustitución o sin es tan minúsculo que no afecta a nuestra probabilidad de forma significativa.

Dejar $X$ sea la variable aleatoria que cuenta el número de aciertos, la probabilidad de obtener exactamente $k$ éxitos de $n$ ensayos independientes en los que la probabilidad de éxito es $p$ para cada ensayo es:

$$Pr(X=k)=\binom{n}{k}p^k(1-p)^{n-k}$$

Conectando $p=0.2, n=300$ y $k=50$ a lo anterior, obtenemos una respuesta inmediata para (iii) de

$$Pr(X=50)=\binom{300}{50}\cdot 0.2^{50}\cdot (1-0.2)^{300-50}\approx 0.0207557$$

Ahora, para las partes anteriores, si tenemos una calculadora lo suficientemente fuerte, podríamos simplemente hacer un bucle a través de una suma y obtener una respuesta exacta como este pero supongo que la solución prevista es más bien acercarse utilizando el aproximación normal a la binomial .

Es bien sabido que una variable aleatoria con distribución binomial tiene media $np$ y la desviación estándar $\sqrt{np(1-p)}$ por lo que en nuestro caso tenemos una media de $60$ y una desviación estándar de $\sqrt{48}\approx 6.93$ .

Puede aproximar el discreto distribución binomial para valores dados de $n,p$ utilizando el continuo distribución normal con media $np$ y la desviación estándar $\sqrt{np(1-p)}$ las áreas bajo la gráfica de cada uno sobre una región serán muy similares siempre que $n$ y $np(1-p)$ son lo suficientemente grandes. Cuanto más grandes sean, más precisa será la aproximación.

Para continuar, para encontrar la aproximación para $Pr(a\leq X\leq b)$ Primero aplicamos una ligera corrección de continuidad rellenando la distancia fuera de la región que nos interesa para cada límite sumando o restando $\frac{1}{2}$ por lo que en su lugar miramos $Pr(a-\frac{1}{2}\leq X\leq b+\frac{1}{2})$ . Esto, de nuevo, porque la distribución binomial era discreta mientras que la distribución normal es continua. ( Con una desviación estándar lo suficientemente grande, este paso podría incluso saltarse )

A continuación, encontramos "cuántas desviaciones estándar por encima de la media $a-\frac{1}{2}$ y $b+\frac{1}{2}$ son respectivamente ( un valor negativo que corresponde a estar realmente esa cantidad por debajo de la media ). Por medio de un poco de álgebra, encontrarás que son $\dfrac{a-\frac{1}{2}-np}{\sqrt{np(1-p)}}$ y $\dfrac{b+\frac{1}{2}-np}{\sqrt{np(1-p)}}$ respectivamente. ( Puede ver esto en su lugar escrito como $\frac{a-\mu}{\sigma}$ . ) Es común escuchar que se refieran a ellos como " $Z$ -Puntuación" o "Puntuación estándar" .

Ahora que hemos encontrado esos valores, podemos hacer la pregunta para una distribución normal estándar, preguntando cuál es la probabilidad de que se encuentre dentro de ese rango de desviaciones estándar de esos valores. Esto puede hacerse mirando una tabla o utilizando una calculadora.

Cuando utilice una tabla, recuerde que $Pr(m\leq Z\leq n) = Pr(Z\leq n) - Pr(Z< m)$


Para el ejemplo de encontrar la probabilidad entre $20$ y $60$ personas son estudiantes de inglés, nos esforzamos por calcular las puntuaciones z adecuadas, que en este caso son $\approx\dfrac{19.5-60}{6.93}\approx -5.844$ y $\approx\dfrac{60.5-60}{6.93}\approx 0.072$ respectivamente.

Encontrando las probabilidades de estos, se puede buscar en una tabla para encontrar $Pr(Z\leq -5.844)\approx 0.0000$ y $Pr(Z\leq 0.072)\approx 0.5287$ respectivamente, por lo que la probabilidad de estar entre $20$ y $60$ personas es aproximadamente $0.5287$ ( comparar con la respuesta exacta de $\approx 0.534476$ que encontramos antes con el cálculo exacto ). ( compárese también con la respuesta de $0.5$ que habríamos obtenido si no hubiéramos utilizado la corrección de continuidad ).

La otra parte puede calcularse de forma similar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X