Tengo esta corrección de unos deberes de matemáticas en los que tenía que trabajar.
Durante las inscripciones universitarias, cada estudiante completa un expediente de inscripción. Todas las comprobaciones realizadas indican que la probabilidad de que cualquier matrícula esté bien cumplimentada es igual a p = 0,94.
-
Introduzca una variable aleatoria X que describa los dos estados posibles de cada fichero.
-
Si n = 5, calcula la probabilidad de los siguientes sucesos : {ningún fichero está bien lleno}, {todos los ficheros están bien llenos}, {X > 3}, { 2 < X < 4}.
-
Si n = 100, ¿qué distribución de probabilidad podemos utilizar para aproximar la distribución de X?
La respuesta a 3) es Para n = 100, podemos aproximar la distribución binomial por la distribución normal con media = np y desviación típica = (npq).
Esta aproximación es válida si np > 5 y nq > 5, lo que se cumple en este caso.
Entiendo que la razón por la que esto es correcto es por el teorema del límite central, que dicta que si n es lo suficientemente grande, entonces una variable aleatoria puede ser modelada usando la distribución normal. Sin embargo no entiendo la última frase, ¿por qué 5? y ¿por qué comprobamos esa suposición con np y nq?