8 votos

Error estándar de proporción que tiene en cuenta el tamaño de la población

¿Existe otro método para estimar los errores estándar de las proporciones que no sea $\sqrt{p(1-p)/n}$ donde se tiene en cuenta un tamaño estimado de la población total?

Por ejemplo, si muestreo 100 de una población de 100, debería tener un error estándar de 0. Si muestreo 100 de mil millones, debería tener un error más alto.

Leí en un blog que la fórmula anterior debe usarse cuando la población es al menos 10 veces más grande que la muestra, pero no sé de dónde proviene esto o si es verdad o qué sucede si una encuesta está cerca de esa muestra 1/10.

9 votos

Busca "ajuste de población finita"

9voto

AdamSane Puntos 1825

Si estás muestreando aleatoriamente sin reemplazo de una población finita, no estás en una situación de muestreo binomial, sino hipergeométrica.

Cuando estás en una situación binomial con proporción poblacional $\pi$, la varianza del conteo, $X$ es $n\pi(1-\pi)$ y por lo tanto la varianza de la proporción de la muestra $p=X/n$ es $n\pi(1-\pi)/n^2=\pi(1-\pi)/n$. Esta varianza de la proporción se estima como $p(1-p)/n$.

En el caso de muestrear $n$ sin reemplazo de una población finita de tamaño $N$, el conteo tiene varianza $n{K\over N}{\frac{N-K}{N}}{N-n\over N-1}$.

Dado que $\pi=K/N$ es la proporción poblacional, podríamos escribir que la varianza del conteo, $X$ es $n\pi(1-\pi){N-n\over N-1}$.

Entonces, la varianza de la proporción de la muestra se puede escribir como $\frac{\pi(1-\pi)}{n}\cdot f$ donde $f={N-n\over N-1}$.

Dado que $f<1$, esta varianza es menor que en el caso binomial (como sugeriste).

$f$ se denomina "la corrección de población finita" (ya que se puede usar para 'corregir' la varianza que se obtiene del binomial), pero como ves, es simplemente la varianza de usar el modelo de probabilidad correcto (es decir, hipergeométrico).

Por supuesto, para corregir el error estándar en lugar de la varianza, debes tomar la raíz cuadrada de ese factor (es decir, $\sqrt{{N-n\over N-1}}$).

Leí en un blog que la fórmula anterior debería usarse cuando la población sea al menos 10 veces más grande que la muestra

Diría que 'debería usarse' es demasiado fuerte. Si bien la fórmula binomial podría usarse, el factor de corrección de población finita siempre es correcto, pero cuando la muestra es una fracción pequeña de la población, el factor de corrección estará cerca de 1, por lo que si lo dejas fuera, se hace poco daño.

¿qué sucede si una encuesta está cerca de esa muestra 1/10?

Veamos qué sucede cuando la muestra es una décima parte de la población.

$f=\frac{N-n}{N-1} = \frac{0.9N}{N-1} \approx 0.9$

Por lo tanto, la corrección al error estándar es aproximadamente $\sqrt{0.9}$ que es aproximadamente $0.95$. Si lo ignoras, tu error estándar será aproximadamente un $5.4\%$ demasiado grande.

Depende de ti decidir si esa cantidad de imprecisión en el error estándar es aceptable o no.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X