Me encuentro con el siguiente problema (situación simplificada). Estoy haciendo un muestreo de un grupo de estudiantes y necesito averiguar el número de familias que tienen 2 hijos (o una probabilidad). Supongamos que
- Los hermanos forman parte del grupo del que tomo muestras
- Los hermanos pueden ser 0 o 1 para simplificar.
Hago la encuesta y obtengo los resultados de la siguiente manera
- 0 hermano, frecuencia = 4
- 1 hermano, frecuencia = 9
Llego a una estimación sesgada de la probabilidad de que una familia determinada tenga 2 hijos como (0*4 + 1*9)/13 = 0,69. Esto está sesgado porque es más probable que tome la muestra de alguien que tiene 1 hermano, dado que todos los hermanos están en el mismo grupo. Si mi población total es de unos 100, ¿qué forma hay de estimar la verdadera probabilidad teniendo en cuenta estos datos? ¿Es posible? ¿Necesito más información?
Para ver el sesgo, supongamos un caso sencillo en el que hay 3 niños. 2 hermanos y 1 soltero, lo que da lugar a 2 familias, una de ellas con 2 hijos. El método de la encuesta anterior daría como resultado $\frac{2}{3}$ probabilidad cuando en realidad debería ser $\frac{1}{2}$ .