5 votos

Calcular tamaño de muestra mínimo

Acabo de empezar un curso de estadísticas y tengo algunas preguntas generales que han surgido tratando de resolver la siguiente pregunta:

Una encuesta de la organización quiere tomar una muestra aleatoria simple con el fin de estimar el porcentaje de personas que han visto un determinado programa. La muestra va a ser tan pequeño como sea posible. La estimación se especificó en el plazo de 1 punto porcentual en el valor verdadero; $\textit{i.e.}$, el ancho del intervalo centrado en la muestra la proporción de los que vio el programa debe ser de 1%. La población de la que la muestra es muy grande. La experiencia pasada sugiere que el porcentaje de la población en el rango de 20% a 40%. ¿Qué tamaño de muestra debe ser tomada?

Creo que tengo que usar esto y resolver para n $$1.96\sqrt{\frac{\pi (1-\pi)}{n}} = .01$$ where $\pi$ es el ejemplo de estimación de la proporción de personas que ven el programa.

Ahora, ¿significa esto que estoy un 95% seguro de que estoy dentro de un 1% de exactitud? Yo también no soy consciente de cómo puedo encontrar $\pi$ a pesar de que he leído que podría utilizar la desviación estándar de población en su lugar y la sospecha de que tendría que usar eso como que me dan algo de información - que el pop proporción es del 20%-40%.

Por último, en general, lo que se dice aquí:

$$\pi \pm 1.96\sqrt{\frac{\pi (1-\pi)}{n}} = .01$$

Mis notas en el momento justo decir que contiene la media de la población es el 95% del tiempo.... por qué? Creo que si tuviera un poco de gráfica de la comprensión de lo que estaba pasando todo sería mucho más sencillo para mí.

1voto

Paul Raff Puntos 490

Veamos algo de la terminología aquí abajo:

  • $\pi$ indican que el verdadero porcentaje de personas que han visto un determinado programa. No sabemos de este valor, y están tratando de estimar por muestreo de la gente y hacer las preguntas.
  • $\hat{\pi}_n$ indican que el estimado de valor que vamos a obtener pidiendo $n$ personas y el cálculo de la proporción. Esta es una variable aleatoria.

Si preguntamos a una persona al azar, sabemos que nuestra respuesta le sigue una Distribución de Bernoulli $Ber(\pi)$, que sabemos tiene una media de $\mu = \pi$ y una desviación estándar de $\sigma = \sqrt{\pi(1-\pi)}$.

El Teorema Central del Límite implica que como $n \to \infty$, nuestra estimación de la proporción $\hat{\pi}_n$ de la aproximación de una Distribución Normal con una media de $\pi$ y la desviación estándar $\frac{\sigma}{\sqrt{n}}$.

A partir de aquí, podemos sustituir "enfoque" con "es" en la frase anterior, y son, básicamente, diciendo que para que una lo suficientemente grande $n$, $\hat{\pi}_n$ es una distribución normal.

Ahora podemos formalizar las preguntas específicas que se están preguntando:

¿Qué significa que estoy un 95% seguro de que estoy dentro de un 1% de exactitud? Esto se traduce en:

$$ Pr(|\hat{\pi}_n-\pi| \leq 0.01\pi) >= 0.95 $$

$|\hat{\pi}_n-\pi|$ representa la manera en off que son de la verdad, y $0.01\pi$ es la mayoría de los que quieren ser apagado. Así que desea que la probabilidad de que esto ocurra al menos el 95%.

Ahora, para solucionar esto debemos normalizar el lado izquierdo:

$$ \begin{align} Pr(|\hat{\pi}_n-\pi| \leq 0.01\pi) &= Pr(-0.01\pi \leq \hat{\pi}_n-\pi \leq 0.01\pi) \\ &= Pr\left(\frac{-0.01\pi}{\sigma} \leq \frac{\hat{\pi}_n-\pi}{\sigma} \leq \frac{0.01\pi}{\sigma}\right) \\ &= Pr\left(\frac{-0.01\pi}{\sigma} \leq Z \leq \frac{0.01\pi}{\sigma}\right) \end{align} $$

donde $Z$ es la distribución normal estándar. Sabemos que esta probabilidad es igual a $0.95$ cuando $$ \frac{0.01\pi}{\sigma} \approx 1.96 $$

Así llegamos a la esencia de su fórmula inicial (donde se interpreta el 1% absoluto)

$$ 1.96\sqrt{\frac{\pi(1-\pi)}{n}} = 0.01\pi $$

Ya que usted sabe que $0.2 \leq \pi \leq 0.4$, puede utilizar el peor de los casos el valor de $\pi$, lo que representa el 0,2 en este caso.

1voto

Suponiendo que $n$ es lo suficientemente grande como para justificar una aproximación normal a la binomial, y que otros supuestos tales como independiente e imparcial de la naturaleza de la muestra, en frecuentista términos, capaz de decir algo como:

El 95% de las veces que se repita este ejercicio, su estimación de la la proporción será dentro de 1 punto porcentual de la proporción verdadera.

La segunda expresión de la $\pi \pm 1.96\sqrt{\dfrac{\pi (1-\pi)}{n}} = .01$ no significa realmente nada. Si su estimación de la proporción es $\hat\pi$ y se han resuelto su primera expresión para$n$, entonces usted podría ser capaz de decir $$\Pr\left(\hat\pi \in \left(\pi - 1.96\sqrt{\frac{\pi (1-\pi)}{n}} , \pi + 1.96\sqrt{\frac{\pi (1-\pi)}{n}} \right) \right) = 0.95$$ but what you may want to say is the similar but reversed $$\Pr\left(\pi \in \left(\hat\pi - 1.96\sqrt{\frac{\hat\pi (1-\hat\pi)}{n}} , \hat\pi + 1.96\sqrt{\frac{\hat\pi (1-\hat\pi)}{n}} \right) \right) = 0.95.$$

El último de estos (que dice algo así como que hay una probabilidad del 95% de la proporción real de estar dentro de un punto porcentual de la estimación de la proporción) no es realmente significativo en frecuentista términos. En su lugar usted necesita métodos Bayesianos.

Ya que no sabe $\pi$ o antes de que la muestra de saber $\hat\pi$, usted podría tomar una peor caso para $\pi$ a trabajar fuera de su tamaño de la muestra. Esto sucede cuando $\pi=\frac12$, en cuyo caso se $n= 1.96^2 \times {\frac14} / 0.01^2 =9604$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X