3 votos

Estimación de las frecuencias de una población

Tengo una muestra de tamaño 1121 de una población de tamaño 2171 y no tengo acceso a ninguna muestra adicional. Los recuentos son

   1   2   3   4   5   6   7   8   9  10  11  12  13  14 
 737 158  70  44  24  15  20  12   6   9   3  10  10   3 

Intento estimar las frecuencias de la población,

Todos los puntos de la población son positivos. ¿La estimación ingenua de

$(737/1121)*2171$ los puntos tienen valor 1,

$(158/1121)*2171$ los puntos tienen valor 2, ect...

sea la medida adecuada.

La muestra son datos de recuento en un análisis de captura-recuperación, es decir, entre todos los periodos de captura hubo un total de 1121 individuos capturados. Entre las capturas, 748 individuos fueron capturados una vez, 158 dos veces, ...estas capturas eran realmente compradores de un producto. Se trata de una pequeña parte del total de compradores. Los compradores totales son la población que se está estimando. Se asume que los compradores que no fueron observados exhiben el mismo comportamiento que los compradores que fueron capturados. Quiero obtener una buena estimación de los recuentos de "compras" en la población estimada para cada individuo.

¿Sería el ajuste de una distribución el enfoque correcto? Si la distribución es la forma adecuada, ¿generaría 2171 valores aleatorios y utilizaría esos recuentos para obtener mi estimación?

0voto

John Puntos 1

Sin más detalles, me parece arriesgado ajustar una distribución. Al menos para las primeras categorías, puedes tener estimaciones bastante buenas de tu población. El valor que has dado es correcto, pero echemos un vistazo al intervalo de confianza del 95% para las primeras categorías. $$\hat{p}\pm z_{\alpha/2}\sqrt{\dfrac{\hat{p}(1-\hat{p})}{n} \cdot \frac{N-n}{N-1}}$$

Usted tiene $z_{\alpha/2}=1.96$ , $N=2171$ , $n=1121$ . Según mis cálculos daría esta fórmula simplificada : $$\hat{p}\pm 0.04071\times\sqrt{\hat{p}(1-\hat{p})}$$ La anchura máxima de este intervalo viene dada por $\hat{p}=1/2$ por lo que acabará con un intervalo de confianza del 95% más estrecho que 0,02.

Después de tu comentario "Así que técnicamente no es una "muestra" de la población" no estoy muy seguro de que sea una estimación legítima. Quizá deberías explicar con más detalle cómo se obtiene esta muestra y para qué quieres esta estimación.


Editar después de OP detalles

Como realmente no sé cómo tratar el análisis de captura-recaptura, tal vez haya algunas distribuciones relacionadas que sí encajen. Le sugiero que edite su pregunta añadiendo esta nueva información. Pero, a primera vista, no veo ningún problema con mi respuesta. Sin embargo, como en teoría los recuentos deberían disminuir, tal vez sólo el ajuste de la 6ª a la 14ª con una distribución, aunque sea muy simple (como la lineal), podría proporcionar mejores estimaciones que las que he sugerido. Pero ...a segunda vista...este comentario también sugiere que los datos pueden ser realmente ruidosos, y que quieres predecir resultados futuros por este proceso de recaptura. En realidad, esto no es lo mismo que muestrear medidas de una población.

Así que, finalmente, si lo que pienso sobre tus datos y tu objetivo es correcto, mi respuesta no puede sostenerse realmente y te sugeriría que fueras a ajustar tus datos con una distribución.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X