4 votos

Tamaño de la muestra e intervalo de confianza conservador

Queremos producir un $90%$ intervalo de confianza para la proporción de recetas vegetarianas en un libro de cocina. Vamos a utilizar el muestreo aleatorio simple sin el reemplazo de seleccionar una muestra de $2311$ recetas en el libro. Queremos que la longitud del intervalo es en la mayoría de las $0.06$. Encontrar el mínimo de la muestra tamaño para que podamos construir el intervalo.

Tenemos que el intervalo de confianza para la proporción es $$\overline{Y}-z_\frac{\alpha}{2}\sqrt{(1-f)\frac{\hat{P}(1-\hat{P})}{n-1}}\leq\mu\leq \overline{Y}+z_\frac{\alpha}{2}\sqrt{(1-f)\frac{\hat{P}(1-\hat{P})}{n-1}}$$

donde $f=\frac{n}{N}$, $n$ es el tamaño de la muestra y $N=2311$ es el tamaño de la población, pero como no conocemos los valores de $\hat{P}$, hice un conservador intervalo de confianza, en sustitución de $$\hat{P}(1-\hat{P})\Rightarrow \frac{1}{4}$$ el intervalo es $$\overline{Y}-z_\frac{\alpha}{2}\sqrt{\frac{(1-f)}{4(n-1)}}\leq\mu\leq \overline{Y}+z_\frac{\alpha}{2}\sqrt{\frac{(1-f)}{4(n-1)}}$$ a continuación, la longitud es de $$2z_\frac{\alpha}{2}\sqrt{\frac{(1-f)}{4(n-1)}}=0.06$$ $$2z_\frac{\alpha}{2}\sqrt{\frac{(1-\frac{n}{N})}{4(n-1)}}=0.06$$ $$2*1.64\sqrt{\frac{(1-\frac{n}{N})}{4(n-1)}}=0.06$$

pero yo no podía resolver esta ecuación, y también no estoy seguro si este es el correcto razonamiento.

3voto

Creosote Puntos 1393

Este es un sorprendentemente difícil pregunta si he interpretado correctamente y se necesita una respuesta exacta. Me disculpo de antemano si lo que sigue es en gran parte incomprensible.

Voy a revisar los hechos primero. Hay $N=2311$ recetas, un número desconocido $V$ de los que son vegetarianos. Podrá degustar $n$ recetas sin reemplazo, y se desea saber el más pequeño $n$ puede utilizar tal que hay un $90\%$ intervalo de confianza de ancho en la mayoría de las $0.06N$$V$. Cada CI estará un par de enteros, $(a,b)$, de tal manera que $b-a\le\lfloor 0.06N\rfloor=138$. Sí?

OK, vamos a $P(N,V,n,v)=\binom{V}{v}\binom{N-V}{n-v}/\binom{N}{n}$ la probabilidad de que $n$ muestras de rendimiento $v$ verduras recetas: llamada de que un $(n,v)$ resultado. Deje $I(N,V,n,v)$ $1$ si el CI de una $(n,v)$ resultado contiene $V$; o $0$ lo contrario. Deje $C(N,V,n)=\sum_v P(N,V,n,v) \times I(N,V,n,v)$, la "cobertura" de $V$, o la probabilidad de que el CI de una $(n,\cdot)$ resultado contiene $V$. Para $90\%$ de confianza, necesitamos $C(N,V,n)\ge 0.9$ todos los $V\in{0,1,2,\ldots,N}$. Así que, ¿cuál es el más pequeño de $n$ ejemplo de que es posible construir CIs reunión que la cobertura de umbral?

Vamos a tratar cada una de las $n=1,2,3,\ldots$ a su vez hasta que encuentre uno que funcione. Para comprobar si un determinado $n$, se utiliza un algoritmo voraz. Inicialmente, no hay CIs y la cobertura es $0$ todos los $V$. Conjunto de la CI $(0,\ldots,138)$$(n,0)$. Esto le da a $100\%$$V=0$, pero menor cobertura para mayor $V$. Encontrar el más pequeño de $V$, con una cobertura de menos de $90\%$: iniciar el CI para $(n,1)$ en ese punto. Repetir, a partir de la Cei para $(n,2), (n,3)$, etc en los $V$ que aún no $90\%$ cubierto. Te voy a hacer hasta el final, $V=N$, o de ejecutar fuera de la Cei. Si usted lo hace, $n$ es bueno; de lo contrario $n$ es mala.

Este algoritmo encuentra el número mínimo de muestras, $n=546$.

Es una cosa para ver cuál es la cobertura de salir de este algoritmo; ver abajo.

funky graph

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X