2 votos

Cálculo del número de personas con el mismo nombre y fecha de nacimiento a partir de datos muestrales

Un país tiene una población de 40 000 000 de habitantes.

Tengo una muestra con datos de 1 500 000 personas de este país.

En esta muestra, el 1,9% de las personas tienen una "pareja" (una o más) con el mismo nombre, apellidos y fecha de nacimiento (pero que no es la misma persona).

¿Puedo utilizar esta información para calcular cuántas personas de toda la población tienen una "pareja" con el mismo nombre y fecha de nacimiento?

2voto

Mohammad Hasan Puntos 6

Su proporción muestral de tener un "par" es $\hat{p} = 0.019$ que es la mejor estimación de la proporción poblacional (suponiendo un muestreo aleatorio). Así pues, establecemos $\hat{p} = p$ y, por lo tanto, el número de personas de la población que tienen un "par" es $40,000,000 \times 0.019 = 760,000$ .

Suponiendo ahora observaciones independientes (su muestra es aproximadamente el 3,75% de la población, así que de acuerdo) y un número suficiente tanto de "fracasos" como de "éxitos" (ambos tienen más de 10 observaciones, así que de acuerdo), entonces: $$ \hat{p} \sim N(p, \frac{p(1-p)}{N})$$ El error típico se define como la desviación típica de la distribución muestral de $\hat{p}$ Así que en este caso: $$ SE = \sqrt{\frac{p(1-p)}{N}} = \sqrt{\frac{0.019(1-0.019)}{1,500,000}} = 0.0001$$ Nótese que es tan pequeño porque N es muy grande. Ahora, para construir un intervalo de confianza del 95%: $$\hat{p} \pm 1.96\times SE = 0.019 \pm 0.000196 = [0.018804, 0.019196]$$ Trasladando esto de nuevo a la población, el número "verdadero" de personas de la población que tienen un "par" se encuentra en el intervalo $[752160, 767840]$ . (En la interpretación del intervalo de confianza hay mucho más, pero no voy a extenderme aquí).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X