Ampliando la respuesta de @Scortchi . . .
Supongamos que la población tiene 5 miembros y usted tiene presupuesto para tomar una muestra de 5 individuos. Te interesa la media poblacional de una variable X, una característica de los individuos de esta población. Podrías hacerlo a tu manera, y tomar una muestra aleatoria con reemplazo. La varianza de la media muestral será V(X)/5.
Por otro lado, supongamos que se toman muestras de los cinco individuos sin reemplazo. Entonces, la varianza de la media muestral es 0. Has muestreado toda la población, cada individuo exactamente una vez, por lo que no hay distinción entre "media muestral" y "media poblacional". Son la misma cosa.
En el mundo real, debería saltar de alegría cada vez que tenga que hacer la corrección de la población finita porque (redoble de tambores ) hace que la varianza de su estimador disminuya sin que tenga que recoger más datos. Casi nada hace esto. Es como magia: magia de la buena.
Diciendo exactamente lo mismo en matemáticas (prestar atención al <, y asumir que el tamaño de la muestra es mayor que 1): \begin {Ecuación} \textrm {corrección de muestra finita} = \frac {N-n}{N-1} < \frac {N-1}{N-1} = 1 \end {Ecuación}
Corrección < 1 significa que la aplicación de la corrección hace que la varianza descienda, porque se aplica la corrección multiplicándola por la varianza. Varianza ABAJO == bueno.
En la dirección opuesta, alejándose por completo de las matemáticas, piense en lo que está preguntando. Si quieres aprender sobre la población y puedes tomar una muestra de 5 personas de ella, ¿te parece probable que aprendas más si te arriesgas a tomar una muestra del mismo tipo 5 veces o te parece más probable que aprendas más si te aseguras de tomar una muestra de 5 tipos diferentes?
El caso del mundo real es casi lo contrario de lo que dices. Casi nunca se muestrea con reemplazo, sólo cuando se hacen cosas especiales como el bootstrapping. En ese caso, en realidad estás tratando de estropear el estimador y darle una varianza "demasiado grande".
3 votos
Sugerencia: considere cuál es el efecto de aplicar la corrección por población finita y por qué puede ser ventajoso. (Tenga en cuenta también que (1) hacer sumas es casi siempre menos problemático y costoso que recoger datos; (2) si puede distinguir los individuos no debería "reciclar" las mediciones, sino basar la inferencia sólo en los individuos distintos).
0 votos
Sinceramente, no entiendo ninguna de sus afirmaciones. El CPF compensa las consecuencias numéricas de la falta de independencia de las mediciones. Pero no sé por qué esto es ventajoso. (1) ¿Qué relación tiene esto con mi pregunta? (2) ¿Por qué "no debería" reciclar una medición? ¿Hacerlo no es la consecuencia lógica directa de haber extraído casualmente dos veces el mismo elemento al realizar un muestreo con reemplazo?