Tengo una muestra de tamaño 1121 de una población de tamaño 2171 y no tengo acceso a ninguna muestra adicional. Los recuentos son
1 2 3 4 5 6 7 8 9 10 11 12 13 14
737 158 70 44 24 15 20 12 6 9 3 10 10 3
Intento estimar las frecuencias de la población,
Todos los puntos de la población son positivos. ¿La estimación ingenua de
$(737/1121)*2171$ los puntos tienen valor 1,
$(158/1121)*2171$ los puntos tienen valor 2, ect...
sea la medida adecuada.
La muestra son datos de recuento en un análisis de captura-recuperación, es decir, entre todos los periodos de captura hubo un total de 1121 individuos capturados. Entre las capturas, 748 individuos fueron capturados una vez, 158 dos veces, ...estas capturas eran realmente compradores de un producto. Se trata de una pequeña parte del total de compradores. Los compradores totales son la población que se está estimando. Se asume que los compradores que no fueron observados exhiben el mismo comportamiento que los compradores que fueron capturados. Quiero obtener una buena estimación de los recuentos de "compras" en la población estimada para cada individuo.
¿Sería el ajuste de una distribución el enfoque correcto? Si la distribución es la forma adecuada, ¿generaría 2171 valores aleatorios y utilizaría esos recuentos para obtener mi estimación?