4 votos

Cada letra tiene un% de probabilidad de ser contestada; ¿Cuántas cartas enviar para estar$40\%$ seguro de obtener 200 respuestas?

Un investigador sabe que la probabilidad de que un cuestionario se responda por correo es del 40%. Quiere estar seguro al 99% de que recibirá por lo menos 200 cuestionarios respondidos. ¿Cuántos cuestionarios debe enviar por correo para estar 99% seguro de que recibirá al menos 200 respuestas?

10voto

mat_geek Puntos 1367

La binomial exacto de los intervalos de confianza son obtenidos por un método que implica una integral que se describe en un documento por parte de Clopper y Pearson alrededor de 1934. Es por eso que es a menudo llamado el Clopper-método de Pearson. Para cualquier $n >200$, en tu caso, puede utilizar ese método para calcular un solo lado del 99% intervalo de confianza para el número de respuestas. Mantener el aumento de $n$ hasta este límite superior supera $200$. Ahora desde $n$ va a ser grande el normal aproximada intervalo de confianza puede ser utilizado como una buena aproximación. Que es lo que usted haría si usted no sabía que $p=0.40$ y se estima que a partir de los datos. Así que en lugar de un intervalo de confianza se puede calcular el punto exacto en el cual $99\%$ de la distribución binomial se cae abajo. El uso de la normal distribución aproximada se aproxima a este intervalo de probabilidad. Que es lo que gui11aume hice con R.

8voto

Ash Puntos 121

Cuántas pruebas antes de llegar a 200 éxitos, que en realidad es la definición de la binomial negativa. En R calcular con esto:

200 + qnbinom(0.99, 200, 0.4)
[1] 567

Una binomial negativa de la densidad (R: dnbinom) le da la prob de que un cierto número x de fallos será necesario obtener 200 éxitos. Suma que para obtener el CDF (R: pnbinom), es decir, la probabilidad de que en la mayoría de los x fallas de los 200 éxitos. Por el contrario, la función cuantil le dice que con una probabilidad de 99%, 367 fallas será suficiente para obtener los 200 éxitos. Dicho de otro modo, no existe (aproximadamente) de 1% de probabilidad de que más de 367 fallos (es decir, 567 ensayos) serán necesarios para obtener los 200 éxitos.

Cap

5voto

JMW.APRN Puntos 21

Usando R y la función pbinom(k, ..., lower.tail=FALSE) que da la probabilidad de que el número de éxito observado sea mayor que$k$ (el complemento de la probabilidad acumulada de$k$), puede hacerlo de esta manera camino:

 # The size has to be at least 200.
size <- 200
# Increase size until threshold is hit.
while(pbinom(200, size, prob=.4, lower.tail=F) < .99) {
   size = size+1
}
 

La solución anterior debería hacer, si está realmente interesado en la solución y cómo obtener una respuesta práctica. Sin embargo, si esto es tarea, no puedo garantizar que esto sea suficiente ;-)

2voto

Niall Puntos 51

Deje $X$ denotar el número de letras respondió a y $n$ el número de cartas enviadas. Este problema es matemáticamente equivalente a la resolución por la mínima $n$ tal que $$P(X \leq 200) \leq .01$$

Para obtener una forma cerrada (aproximación) de la solución, podemos usar la aproximación normal a la binomial, que dice que $X$ es de aproximadamente $N(\mu, \sigma^2)$ distribuido donde$\mu = np = .4n$$\sigma^2 = np(1-p) = .24n$. Como Michael Chernick, señaló en su respuesta, este tamaño de la muestra es lo suficientemente grande para esta aproximación razonable.

Usando esta aproximación, podemos reducir el problema a resolver por la mínima $n$ tal que

$$ P(X \leq 200) = \Phi \left( \frac{ 200 - .4n }{\sqrt{.24n}} \right) \leq .01 $$

donde $\Phi(\cdot)$ es el normal de la CDF. Esto es equivalente a encontrar el mínimo de $n$ tal que

$$ 200 \leq \sqrt{.24n} \cdot \Phi^{-1}(.01) + .4n $$

Dado que esta es una forma monotónica, para encontrar el mínimo de $n$ es suficiente para comprobar dónde exacta igualdad se produce; si sustituimos $ x= \sqrt{n} $ tenemos una simple ecuación cuadrática en esta escala transformada:

$$ .4x^2 + .24 \cdot \Phi^{-1}(.01) x - 200 = 0 $$

que puede ser fácilmente resuelto mediante la fórmula cuadrática con

$$ a = .4 $$

$$ b = \sqrt{.24} \Phi^{-1}(.01) $$

$$ c = -200 $$

que el rendimiento de las soluciones

$$ x = \frac{ -b \pm \sqrt{b^2 -4ac} }{2a} = \{-20.98142, 23.83061 \}$$

Debemos tomar la solución positiva, ya que $\sqrt{n}$ claramente debe ser positivo. También debemos ronda, ya que el resultado debe ser un número entero. El cuadrado de este y redondeo da el tamaño mínimo de muestra: $$ n = \lceil 23.83061^2 \rceil = \lceil 567.898 \rceil = 568 $$.

Tenga en cuenta que este cerca está de acuerdo con el cálculo exacto usando la distribución Binomial (yo tengo la $n = 567$).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X