2 votos

Cálculo del número de personas con el mismo nombre y fecha de nacimiento a partir de datos muestrales

Un país tiene una población de 40 000 000 de habitantes.

Tengo una muestra con datos de 1 500 000 personas de este país.

En esta muestra, el 1,9% de las personas tienen una "pareja" (una o más) con el mismo nombre, apellidos y fecha de nacimiento (pero que no es la misma persona).

¿Puedo utilizar esta información para calcular cuántas personas de toda la población tienen una "pareja" con el mismo nombre y fecha de nacimiento?

2voto

Mohammad Hasan Puntos 6

Su proporción muestral de tener un "par" es p^=0.019 que es la mejor estimación de la proporción poblacional (suponiendo un muestreo aleatorio). Así pues, establecemos p^=p y, por lo tanto, el número de personas de la población que tienen un "par" es 40,000,000×0.019=760,000 .

Suponiendo ahora observaciones independientes (su muestra es aproximadamente el 3,75% de la población, así que de acuerdo) y un número suficiente tanto de "fracasos" como de "éxitos" (ambos tienen más de 10 observaciones, así que de acuerdo), entonces: p^N(p,p(1p)N) El error típico se define como la desviación típica de la distribución muestral de p^ Así que en este caso: SE=p(1p)N=0.019(10.019)1,500,000=0.0001 Nótese que es tan pequeño porque N es muy grande. Ahora, para construir un intervalo de confianza del 95%: p^±1.96×SE=0.019±0.000196=[0.018804,0.019196] Trasladando esto de nuevo a la población, el número "verdadero" de personas de la población que tienen un "par" se encuentra en el intervalo [752160,767840] . (En la interpretación del intervalo de confianza hay mucho más, pero no voy a extenderme aquí).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X