Resumen
El modelo simple de que todos los nacimientos, independientemente, tienen un 50% de probabilidades de ser niñas es poco realista y, por lo visto, excepcional. En cuanto consideramos las consecuencias de la variación de los resultados entre la población, la respuesta es que la proporción niña/niño puede ser tout valor no superior a 1:1. (En realidad, es probable que siga siendo cercano a 1:1, pero eso es algo que debe determinar el análisis de los datos).
Dado que estas dos respuestas contradictorias se obtienen asumiendo la independencia estadística de los resultados de los nacimientos, la apelación a la independencia es una explicación insuficiente. Por lo tanto, parece que variación (en las probabilidades de nacimientos femeninos) es la idea clave de la paradoja.
Introducción
Una paradoja se produce cuando pensamos que tenemos buenas razones para creer algo, pero nos enfrentamos a un argumento que parece sólido en sentido contrario.
La resolución satisfactoria de una paradoja nos ayuda a entender tanto lo que estaba bien como lo que podía estar mal sobre ambos argumentos. Como suele ocurrir en probabilidad y estadística, ambos argumentos pueden ser válidos: la resolución dependerá de las diferencias entre suposiciones que se hacen implícitamente. La comparación de estos diferentes supuestos puede ayudarnos a identificar qué aspectos de la situación conducen a respuestas diferentes. Identificar estos aspectos, sostengo, es lo que más debemos valorar.
Supuestos
Como se desprende de todas las respuestas publicadas hasta ahora, es natural suponer que los nacimientos femeninos se producen independientemente y con probabilidades constantes de $1/2$ . Es bien sabido que ninguna de las dos suposiciones es realmente cierta, pero parece que ligeras desviaciones de estas suposiciones no deberían afectar mucho a la respuesta. Veamos. Para ello, consideremos el siguiente modelo más general y más realista:
-
En cada familia $i$ la probabilidad de que nazca una mujer es una constante $p_i$ , independientemente del orden de nacimiento.
-
En ausencia de una regla de parada, el número esperado de nacimientos de mujeres en la población debería ser cercano al número esperado de nacimientos de hombres.
-
Todos los resultados del nacimiento son (estadísticamente) independientes.
Esto todavía no es un modelo totalmente realista de los nacimientos humanos, en los que el $p_i$ puede variar con la edad de los padres (sobre todo de la madre). Sin embargo, es lo suficientemente realista y flexible como para ofrecer una resolución satisfactoria de la paradoja que se aplicará incluso a modelos más generales.
Análisis
Aunque es interesante realizar un análisis exhaustivo de este modelo, los puntos principales resultan evidentes incluso cuando se considera una versión específica y sencilla (pero algo extrema). Supongamos que la población tiene $2N$ familias. En la mitad de ellas la posibilidad de que nazca una mujer es $2/3$ y en la otra mitad la posibilidad de que nazca una mujer es $1/3$ . Esto satisface claramente la condición (2): el número esperado de nacimientos de mujeres y de hombres es el mismo.
Considere los primeros $N$ familias. Razonemos en términos de expectativas, entendiendo que los resultados reales serán aleatorios y, por tanto, variarán un poco de las expectativas. (La idea que subyace en el siguiente análisis se transmitió de forma más breve y sencilla en la respuesta original que aparece al final de este post).
Dejemos que $f(N,p)$ sea el número esperado de nacimientos de mujeres en una población de $N$ con una probabilidad de natalidad femenina constante $p$ . Obviamente, esto es proporcional a $N$ y así se puede escribir $f(N,p) = f(p)N$ . Del mismo modo, dejemos que $m(p)N$ sea el número esperado de nacimientos masculinos.
-
La primera $pN$ las familias producen una niña y se detienen. Las otras $(1-p)N$ las familias producen un niño y siguen teniendo hijos. Eso es $pN$ niñas y $(1-p)N$ chicos hasta ahora.
-
El resto $(1-p)N$ las familias están en la misma situación que antes: la hipótesis de independencia (3) implica que lo que experimentan en el futuro no se ve afectado por el hecho de que su primogénito fuera un hijo. Así, estas familias producirán $f(p)[(1-p)N]$ más niñas y $m(p)[(1-p)N]$ más chicos.
Sumando el total de chicas y el total de chicos y comparando con sus valores supuestos de $f(p)N$ et $m(p)N$ da ecuaciones
$$f(p)N = pN + f(p)(1-p)N\ \text{ and }\ m(p)N = (1-p)N + m(p)(1-p)N$$
con soluciones
$$f(p) = 1\ \text{ and }\ m(p) = \frac{1}{p}-1.$$
El número previsto de niñas en la primera $N$ familias, con $p=2/3$ Por lo tanto, es $f(2/3)N = N$ y el número esperado de niños es $m(2/3)N = N/2$ .
El número previsto de niñas en el segundo $N$ familias, con $p=1/3$ Por lo tanto, es $f(1/3)N = N$ y el número esperado de niños es $m(1/3)N = 2N$ .
Los totales son $(1+1)N = 2N$ niñas y $(1/2+2)N = (5/2)N$ chicos. Para los grandes $N$ la relación esperada se acercará a la relación de las expectativas,
$$\mathbb{E}\left(\frac{\text{# girls}}{\text{# boys}}\right) \approx \frac{2N}{(5/2)N} = \frac{4}{5}.$$
La regla de la parada favorece a los chicos.
De forma más general, la mitad de las familias dan a luz a niñas de forma independiente con probabilidad $p$ y la otra mitad lleva niños de forma independiente con probabilidad $1-p$ las condiciones (1) a (3) siguen aplicándose y el ratio esperado para los grandes $N$ se acerca a
$$\frac{2p(1-p)}{1 - 2p(1-p)}.$$
En función de $p$ que, por supuesto, se encuentra entre $0$ et $1$ este valor puede estar entre $0$ et $1$ (pero nunca más grande que $1$ ). Alcanza su máximo de $1$ sólo cuando $p=1/2$ . En otras palabras, una proporción esperada de niña:niño de 1:1 es una excepción especial a la regla más general y realista de que parar con la primera niña favorece que haya más niños en la población.
Resolución
Si tu intuición es que parar con la primera chica debe para producir más varones en la población, entonces estás en lo cierto, como muestra este ejemplo. Para estar en lo cierto lo único que necesitas es que la probabilidad de dar a luz a una niña varíe (aunque sea un poco) entre las familias.
La respuesta "oficial", según la cual la proporción debe ser cercana a 1:1, requiere varios supuestos poco realistas y sensibles: supone que no puede haber variación entre las familias y que todos los nacimientos deben ser independientes.
Comentarios
La idea clave que destaca este análisis es que La variación dentro de la población tiene importantes consecuencias. La independencia de los nacimientos -aunque es una suposición simplificadora utilizada para cada análisis en este hilo- no no resolver la paradoja, ya que (dependiendo de los demás supuestos) es coherente tanto con la respuesta oficial como con su contraria.
Sin embargo, hay que tener en cuenta que para que la relación esperada se aleje sustancialmente de 1:1, necesitamos un lote de variación entre los $p_i$ en la población. Si todos los $p_i$ están, por ejemplo, entre 0,45 y 0,55, entonces los efectos de esta variación no serán muy notables. Al abordar esta cuestión de cuál es el $p_i$ en una población humana requiere un conjunto de datos bastante amplio y preciso. Se podría utilizar un modelo lineal mixto generalizado y probar sobredispersión .
Si sustituimos el género por alguna otra expresión genética, obtenemos una simple explicación estadística de selección natural Una regla que limita diferencialmente el número de descendientes en función de su composición genética puede alterar sistemáticamente las proporciones de esos genes en la siguiente generación. Cuando el gen no está ligado al sexo, incluso un pequeño efecto se propagará de forma multiplicativa a través de las sucesivas generaciones y puede magnificarse rápidamente.
Respuesta original
Cada hijo tiene un orden de nacimiento: primogénito, segundón, etc.
Suponiendo que las probabilidades de nacimientos de hombres y mujeres sean iguales y que no haya correlaciones entre los géneros, la Ley Débil de los Grandes Números afirma que habrá una proporción cercana a 1:1 de primogénito las hembras a los machos. Por la misma razón, habrá una proporción cercana a 1:1 entre las segundas hembras y los machos, y así sucesivamente. Dado que estas proporciones son constantemente de 1:1, la proporción global debe ser también de 1:1, independientemente de cuáles sean las frecuencias relativas de los órdenes de nacimiento en la población.