8 votos

¿Cuál es la precisión de los datos obtenidos mediante una muestra aleatoria?

Soy un novato en estadísticas, así que si hago alguna suposición errónea aquí, por favor, dímelo.

Hay una población N de personas. (Por ejemplo N puede ser de 1.000.000). Algunos son pelirrojos. Tomo una muestra n de personas (digamos 10,) y encontrar que j de ellos son pelirrojos.

¿Qué puedo decir sobre la proporción general de pelirrojos en la población? Es decir, mi mejor aproximación es probablemente j/n pero ¿cuál sería la desviación estándar de esa aproximación?

Por cierto, ¿cuál es el término aceptado para esto?

8voto

Omar Kooheji Puntos 384

Se puede pensar en esto como un ensayo binomial - sus ensayos están muestreando "pelirrojo" o "no pelirrojo". En este caso, puede construir un intervalo de confianza para su proporción muestral ( $j/n$ ) como se documenta en Wikipedia:

Un intervalo de confianza del 95% dice básicamente que, utilizando el mismo algoritmo de muestreo, si se repitiera 100 veces, la proporción verdadera se encontraría en el intervalo indicado 95 veces.

Actualización Por cierto, creo que el término que buscas puede ser error estándar que es la desviación estándar de las proporciones muestreadas. En este caso, es $\sqrt{{p (1-p)} \over {n}}$ donde $p$ es su proporción estimada. Tenga en cuenta que como $n$ aumenta, el error estándar disminuye.

0voto

Mike Green Puntos 457

si el tamaño de la muestra $n$ no es una fracción tan pequeña del tamaño de la población $N$ como en su ejemplo, y si se muestrea sin reemplazo [Sw/oR], una mejor expresión para el SE [estimado] es

$$\hat{SE} = \sqrt{\frac{N - n}{N}\frac{\hat p \hat q}{n}},$$

donde $\hat p$ es la proporción estimada $j/n$ y $\hat q = 1- \hat p$ .

[el término $\frac{N-n}{N}$ se denomina FPC [corrección de la población finita].

aunque el comentario de whuber es técnicamente correcto, parece sugerir que nada puede hacerse para obtener, por ejemplo, un intervalo de confianza para la verdadera proporción $p$ . si $n$ es lo suficientemente grande como para que una aproximación normal sea razonable [ $np > 10$ , digamos], es poco probable que se consiga $j=0$ . además, si el tamaño de la muestra es lo suficientemente grande para una aproximación normal utilizando el verdadero $SE$ para ser razonable, utilizando $\hat{SE}$ en su lugar también da una aproximación razonable.

[si su $n$ es realmente pequeño y se utiliza Sw/oR, es posible que tenga que utilizar la distribución hipergeométrica exacta para $j$ en lugar de una aproximación normal. si hace SwR, el tamaño de $N$ es irrelevante y se pueden utilizar métodos binomiales exactos para obtener un IC para $p$ .]

en cualquier caso, ya que $p(1-p) \le 1/4$ Siempre se puede ser conservador y utilizar $\frac{1}{2\sqrt{n}}$ en lugar de $\sqrt{\frac{\hat p \hat q}{n}}$ en lo anterior. si se hace eso, se toma una muestra de $n = 1,111$ para obtener un ME estimado [margen de error = 2 $\hat {SE}$ ] de $\pm$ .03 [independientemente del tamaño $N$ es!].

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X