Un investigador sabe que la probabilidad de que un cuestionario se responda por correo es del 40%. Quiere estar seguro al 99% de que recibirá por lo menos 200 cuestionarios respondidos. ¿Cuántos cuestionarios debe enviar por correo para estar 99% seguro de que recibirá al menos 200 respuestas?
Respuestas
¿Demasiados anuncios?La binomial exacto de los intervalos de confianza son obtenidos por un método que implica una integral que se describe en un documento por parte de Clopper y Pearson alrededor de 1934. Es por eso que es a menudo llamado el Clopper-método de Pearson. Para cualquier $n >200$, en tu caso, puede utilizar ese método para calcular un solo lado del 99% intervalo de confianza para el número de respuestas. Mantener el aumento de $n$ hasta este límite superior supera $200$. Ahora desde $n$ va a ser grande el normal aproximada intervalo de confianza puede ser utilizado como una buena aproximación. Que es lo que usted haría si usted no sabía que $p=0.40$ y se estima que a partir de los datos. Así que en lugar de un intervalo de confianza se puede calcular el punto exacto en el cual $99\%$ de la distribución binomial se cae abajo. El uso de la normal distribución aproximada se aproxima a este intervalo de probabilidad. Que es lo que gui11aume hice con R
.
Cuántas pruebas antes de llegar a 200 éxitos, que en realidad es la definición de la binomial negativa. En R
calcular con esto:
200 + qnbinom(0.99, 200, 0.4)
[1] 567
Una binomial negativa de la densidad (R: dnbinom) le da la prob de que un cierto número x de fallos será necesario obtener 200 éxitos. Suma que para obtener el CDF (R: pnbinom), es decir, la probabilidad de que en la mayoría de los x fallas de los 200 éxitos. Por el contrario, la función cuantil le dice que con una probabilidad de 99%, 367 fallas será suficiente para obtener los 200 éxitos. Dicho de otro modo, no existe (aproximadamente) de 1% de probabilidad de que más de 367 fallos (es decir, 567 ensayos) serán necesarios para obtener los 200 éxitos.
Cap
Usando R y la función pbinom(k, ..., lower.tail=FALSE)
que da la probabilidad de que el número de éxito observado sea mayor que$k$ (el complemento de la probabilidad acumulada de$k$), puede hacerlo de esta manera camino:
# The size has to be at least 200.
size <- 200
# Increase size until threshold is hit.
while(pbinom(200, size, prob=.4, lower.tail=F) < .99) {
size = size+1
}
La solución anterior debería hacer, si está realmente interesado en la solución y cómo obtener una respuesta práctica. Sin embargo, si esto es tarea, no puedo garantizar que esto sea suficiente ;-)
Deje $X$ denotar el número de letras respondió a y $n$ el número de cartas enviadas. Este problema es matemáticamente equivalente a la resolución por la mínima $n$ tal que $$P(X \leq 200) \leq .01$$
Para obtener una forma cerrada (aproximación) de la solución, podemos usar la aproximación normal a la binomial, que dice que $X$ es de aproximadamente $N(\mu, \sigma^2)$ distribuido donde$\mu = np = .4n$$\sigma^2 = np(1-p) = .24n$. Como Michael Chernick, señaló en su respuesta, este tamaño de la muestra es lo suficientemente grande para esta aproximación razonable.
Usando esta aproximación, podemos reducir el problema a resolver por la mínima $n$ tal que
$$ P(X \leq 200) = \Phi \left( \frac{ 200 - .4n }{\sqrt{.24n}} \right) \leq .01 $$
donde $\Phi(\cdot)$ es el normal de la CDF. Esto es equivalente a encontrar el mínimo de $n$ tal que
$$ 200 \leq \sqrt{.24n} \cdot \Phi^{-1}(.01) + .4n $$
Dado que esta es una forma monotónica, para encontrar el mínimo de $n$ es suficiente para comprobar dónde exacta igualdad se produce; si sustituimos $ x= \sqrt{n} $ tenemos una simple ecuación cuadrática en esta escala transformada:
$$ .4x^2 + .24 \cdot \Phi^{-1}(.01) x - 200 = 0 $$
que puede ser fácilmente resuelto mediante la fórmula cuadrática con
$$ a = .4 $$
$$ b = \sqrt{.24} \Phi^{-1}(.01) $$
$$ c = -200 $$
que el rendimiento de las soluciones
$$ x = \frac{ -b \pm \sqrt{b^2 -4ac} }{2a} = \{-20.98142, 23.83061 \}$$
Debemos tomar la solución positiva, ya que $\sqrt{n}$ claramente debe ser positivo. También debemos ronda, ya que el resultado debe ser un número entero. El cuadrado de este y redondeo da el tamaño mínimo de muestra: $$ n = \lceil 23.83061^2 \rceil = \lceil 567.898 \rceil = 568 $$.
Tenga en cuenta que este cerca está de acuerdo con el cálculo exacto usando la distribución Binomial (yo tengo la $n = 567$).