49 votos

Número esperado de relación entre el nacimiento de niñas y niños

Me he encontrado con una pregunta en la prueba de aptitud para la entrevista de trabajo sobre el pensamiento crítico. Es algo así:

La República Zorganiana tiene unas costumbres muy extrañas. Las parejas sólo desean tener hijos femeninos ya que sólo las mujeres pueden heredar la riqueza de la familia de la familia, así que si tienen un hijo varón siguen teniendo más hijos hasta que tengan una niña. Si tienen una niña, dejan de tener hijos. ¿Cuál es la proporción de niñas y niños en Zorgania?

No estoy de acuerdo con la respuesta modelo dada por el autor de la pregunta, que es de 1:1. La justificación era que cualquier nacimiento siempre tendrá un 50% de posibilidades de ser hombre o mujer.

¿Puede convencerme con una respuesta más vigorosa matemáticamente de $\text{E}[G]:\text{E}[B]$ si $G$ es el número de chicas y B es el número de chicos en el país?

51voto

martino Puntos 1179

Empezar sin niños

repetir el paso

{

Todas las parejas que siguen teniendo hijos tienen un hijo. La mitad de las parejas tienen varones y la otra mitad tienen mujeres.

Las parejas que tienen mujeres dejan de tener hijos

}

En cada paso se obtiene un número par de machos y hembras y el número de parejas que tienen hijos se reduce a la mitad (es decir, los que tenían hembras no tendrán ningún hijo en el siguiente paso)

Así, en un momento dado se tiene un número igual de hombres y mujeres y de paso el número de parejas que tienen hijos se reduce a la mitad. A medida que se crean más parejas se repite la misma situación y, en igualdad de condiciones, la población contendrá el mismo número de hombres y mujeres

40voto

phloopy Puntos 4285

Dejemos que $X$ sea el número de varones de una familia. En cuanto tienen una niña, dejan de hacerlo, así que

\begin{array}{| l |l | } \hline X=0 & \text{if the first child was a girl}\\ X=1 & \text{if the first child was a boy and the second was a girl}\\ X=2 & \text{if the first two children were boys and the third was a girl}\\ \text{and so on}\ldots &\\ \hline \end{array}

Si $p$ es la probabilidad de que un niño sea varón y si los géneros son independientes entre sí, la probabilidad de que una familia acabe teniendo $k$ los chicos es $$\mbox{P}(X=k)=p^{k}\cdot (1-p),$$ es decir, la probabilidad de tener $k$ niños y luego tener una niña. El número esperado de los chicos es $$ \operatorname{E}X=\sum_{k=0}^\infty kp^k \cdot (1-p)=\sum_{k=0}^\infty kp^k-\sum_{k=0}^\infty kp^{k+1}.$$ Observando que $$\sum_{k=0}^\infty kp^k=\sum_{k=0}^\infty (k+1)p^{k+1}$$ obtenemos $$\sum_{k=0}^\infty kp^k-\sum_{k=0}^\infty kp^{k+1}=\sum_{k=0}^\infty (k+1)p^{k+1}-\sum_{k=0}^\infty kp^{k+1}=\sum_{k=0}^\infty p^{k+1}=p\sum_{k=0}^\infty p^{k}=\frac{p}{1-p}$$ donde usamos que $\sum_{k=0}^\infty p^k=1/(1-p)$ cuando $0<p<1$ (ver serie geométrica ).

Si $p=1/2$ tenemos que $\operatorname{E}X=0.5/0.5$ . Es decir, la familia media tiene 1 niño. Ya sabemos que todas las familias tienen 1 niña, por lo que la proporción se igualará con el tiempo hasta ser $1/1=1$ .

La variable aleatoria $X$ se conoce como variable aleatoria geométrica .

21voto

jldugger Puntos 7490

Resumen

El modelo simple de que todos los nacimientos, independientemente, tienen un 50% de probabilidades de ser niñas es poco realista y, por lo visto, excepcional. En cuanto consideramos las consecuencias de la variación de los resultados entre la población, la respuesta es que la proporción niña/niño puede ser tout valor no superior a 1:1. (En realidad, es probable que siga siendo cercano a 1:1, pero eso es algo que debe determinar el análisis de los datos).

Dado que estas dos respuestas contradictorias se obtienen asumiendo la independencia estadística de los resultados de los nacimientos, la apelación a la independencia es una explicación insuficiente. Por lo tanto, parece que variación (en las probabilidades de nacimientos femeninos) es la idea clave de la paradoja.

Introducción

Una paradoja se produce cuando pensamos que tenemos buenas razones para creer algo, pero nos enfrentamos a un argumento que parece sólido en sentido contrario.

La resolución satisfactoria de una paradoja nos ayuda a entender tanto lo que estaba bien como lo que podía estar mal sobre ambos argumentos. Como suele ocurrir en probabilidad y estadística, ambos argumentos pueden ser válidos: la resolución dependerá de las diferencias entre suposiciones que se hacen implícitamente. La comparación de estos diferentes supuestos puede ayudarnos a identificar qué aspectos de la situación conducen a respuestas diferentes. Identificar estos aspectos, sostengo, es lo que más debemos valorar.

Supuestos

Como se desprende de todas las respuestas publicadas hasta ahora, es natural suponer que los nacimientos femeninos se producen independientemente y con probabilidades constantes de $1/2$ . Es bien sabido que ninguna de las dos suposiciones es realmente cierta, pero parece que ligeras desviaciones de estas suposiciones no deberían afectar mucho a la respuesta. Veamos. Para ello, consideremos el siguiente modelo más general y más realista:

  1. En cada familia $i$ la probabilidad de que nazca una mujer es una constante $p_i$ , independientemente del orden de nacimiento.

  2. En ausencia de una regla de parada, el número esperado de nacimientos de mujeres en la población debería ser cercano al número esperado de nacimientos de hombres.

  3. Todos los resultados del nacimiento son (estadísticamente) independientes.

Esto todavía no es un modelo totalmente realista de los nacimientos humanos, en los que el $p_i$ puede variar con la edad de los padres (sobre todo de la madre). Sin embargo, es lo suficientemente realista y flexible como para ofrecer una resolución satisfactoria de la paradoja que se aplicará incluso a modelos más generales.

Análisis

Aunque es interesante realizar un análisis exhaustivo de este modelo, los puntos principales resultan evidentes incluso cuando se considera una versión específica y sencilla (pero algo extrema). Supongamos que la población tiene $2N$ familias. En la mitad de ellas la posibilidad de que nazca una mujer es $2/3$ y en la otra mitad la posibilidad de que nazca una mujer es $1/3$ . Esto satisface claramente la condición (2): el número esperado de nacimientos de mujeres y de hombres es el mismo.

Considere los primeros $N$ familias. Razonemos en términos de expectativas, entendiendo que los resultados reales serán aleatorios y, por tanto, variarán un poco de las expectativas. (La idea que subyace en el siguiente análisis se transmitió de forma más breve y sencilla en la respuesta original que aparece al final de este post).

Dejemos que $f(N,p)$ sea el número esperado de nacimientos de mujeres en una población de $N$ con una probabilidad de natalidad femenina constante $p$ . Obviamente, esto es proporcional a $N$ y así se puede escribir $f(N,p) = f(p)N$ . Del mismo modo, dejemos que $m(p)N$ sea el número esperado de nacimientos masculinos.

  • La primera $pN$ las familias producen una niña y se detienen. Las otras $(1-p)N$ las familias producen un niño y siguen teniendo hijos. Eso es $pN$ niñas y $(1-p)N$ chicos hasta ahora.

  • El resto $(1-p)N$ las familias están en la misma situación que antes: la hipótesis de independencia (3) implica que lo que experimentan en el futuro no se ve afectado por el hecho de que su primogénito fuera un hijo. Así, estas familias producirán $f(p)[(1-p)N]$ más niñas y $m(p)[(1-p)N]$ más chicos.

Sumando el total de chicas y el total de chicos y comparando con sus valores supuestos de $f(p)N$ et $m(p)N$ da ecuaciones

$$f(p)N = pN + f(p)(1-p)N\ \text{ and }\ m(p)N = (1-p)N + m(p)(1-p)N$$

con soluciones

$$f(p) = 1\ \text{ and }\ m(p) = \frac{1}{p}-1.$$

El número previsto de niñas en la primera $N$ familias, con $p=2/3$ Por lo tanto, es $f(2/3)N = N$ y el número esperado de niños es $m(2/3)N = N/2$ .

El número previsto de niñas en el segundo $N$ familias, con $p=1/3$ Por lo tanto, es $f(1/3)N = N$ y el número esperado de niños es $m(1/3)N = 2N$ .

Los totales son $(1+1)N = 2N$ niñas y $(1/2+2)N = (5/2)N$ chicos. Para los grandes $N$ la relación esperada se acercará a la relación de las expectativas,

$$\mathbb{E}\left(\frac{\text{# girls}}{\text{# boys}}\right) \approx \frac{2N}{(5/2)N} = \frac{4}{5}.$$

La regla de la parada favorece a los chicos.

De forma más general, la mitad de las familias dan a luz a niñas de forma independiente con probabilidad $p$ y la otra mitad lleva niños de forma independiente con probabilidad $1-p$ las condiciones (1) a (3) siguen aplicándose y el ratio esperado para los grandes $N$ se acerca a

$$\frac{2p(1-p)}{1 - 2p(1-p)}.$$

En función de $p$ que, por supuesto, se encuentra entre $0$ et $1$ este valor puede estar entre $0$ et $1$ (pero nunca más grande que $1$ ). Alcanza su máximo de $1$ sólo cuando $p=1/2$ . En otras palabras, una proporción esperada de niña:niño de 1:1 es una excepción especial a la regla más general y realista de que parar con la primera niña favorece que haya más niños en la población.

Resolución

Si tu intuición es que parar con la primera chica debe para producir más varones en la población, entonces estás en lo cierto, como muestra este ejemplo. Para estar en lo cierto lo único que necesitas es que la probabilidad de dar a luz a una niña varíe (aunque sea un poco) entre las familias.

La respuesta "oficial", según la cual la proporción debe ser cercana a 1:1, requiere varios supuestos poco realistas y sensibles: supone que no puede haber variación entre las familias y que todos los nacimientos deben ser independientes.

Comentarios

La idea clave que destaca este análisis es que La variación dentro de la población tiene importantes consecuencias. La independencia de los nacimientos -aunque es una suposición simplificadora utilizada para cada análisis en este hilo- no no resolver la paradoja, ya que (dependiendo de los demás supuestos) es coherente tanto con la respuesta oficial como con su contraria.

Sin embargo, hay que tener en cuenta que para que la relación esperada se aleje sustancialmente de 1:1, necesitamos un lote de variación entre los $p_i$ en la población. Si todos los $p_i$ están, por ejemplo, entre 0,45 y 0,55, entonces los efectos de esta variación no serán muy notables. Al abordar esta cuestión de cuál es el $p_i$ en una población humana requiere un conjunto de datos bastante amplio y preciso. Se podría utilizar un modelo lineal mixto generalizado y probar sobredispersión .

Si sustituimos el género por alguna otra expresión genética, obtenemos una simple explicación estadística de selección natural Una regla que limita diferencialmente el número de descendientes en función de su composición genética puede alterar sistemáticamente las proporciones de esos genes en la siguiente generación. Cuando el gen no está ligado al sexo, incluso un pequeño efecto se propagará de forma multiplicativa a través de las sucesivas generaciones y puede magnificarse rápidamente.


Respuesta original

Cada hijo tiene un orden de nacimiento: primogénito, segundón, etc.

Suponiendo que las probabilidades de nacimientos de hombres y mujeres sean iguales y que no haya correlaciones entre los géneros, la Ley Débil de los Grandes Números afirma que habrá una proporción cercana a 1:1 de primogénito las hembras a los machos. Por la misma razón, habrá una proporción cercana a 1:1 entre las segundas hembras y los machos, y así sucesivamente. Dado que estas proporciones son constantemente de 1:1, la proporción global debe ser también de 1:1, independientemente de cuáles sean las frecuencias relativas de los órdenes de nacimiento en la población.

14voto

Anooj Krishnan G Puntos 103

El nacimiento de cada niño es un independiente evento con P=0,5 para un niño y P=0,5 para una niña. Los demás detalles (como las decisiones familiares) sólo distraen de este hecho. La respuesta, pues, es que la proporción es de 1:1 .

Para explicarlo: imagine que en lugar de tener hijos, lanza una moneda justa (P(cara)=0,5) hasta obtener una "cara". Digamos que la familia A lanza la moneda y obtiene la secuencia de [cruz, cruz, cara]. Entonces la Familia B lanza la moneda y obtiene una cruz. Ahora, ¿cuál es la probabilidad de que la siguiente sea cara? Todavía 0,5 porque eso es lo que independiente significa. Si se hiciera esto con 1000 familias (lo que significa que salieron 1000 cabezas), el número total esperado de colas es de 1000, porque cada volteo (evento) fue completamente independiente.

Algunas cosas son no independientes, como la secuencia dentro de una familia: la probabilidad de la secuencia [cabezas, cabezas] es 0, no es igual a [colas, colas] (0,25). Pero como la pregunta no se refiere a esto, es irrelevante.

6voto

Clair Hardesty Puntos 41

Las parejas con exactamente una niña y ningún niño son las más comunes

La razón por la que todo esto funciona es porque la probabilidad del escenario en el que hay más chicas es mucho mayor que la de los escenarios en los que hay más chicos. Y los escenarios en los que hay muchos más chicos tienen probabilidades muy bajas. La forma concreta en que se resuelve se ilustra a continuación

NumberOfChilden Probability  Girls   Boys  
1               0.5           1       0  
2               0.25          1       1  
3               0.125         1       2  
4               0.0625        1       3  
...             ...           ...     ...  

NumberOfChilden Probability   Girls*probabilty   Boys*probabilty 
1               0.5           0.5                0
2               0.25          0.25               0.25
3               0.125         0.125              0.25
4               0.0625        0.0625             0.1875
5               0.03125       0.03125            0.125
...             ...           ...                ...  
n               1/2^n         1/(2^n)            (n-1)/(2^n)

A estas alturas ya puedes ver a dónde va esto, el total de las chicas y los chicos van a sumar uno.

Se espera que las niñas de una pareja ${}=\sum_{n=1}^\infty(\frac{1}{2^n})=1 $
Los niños esperados de una pareja ${}=\sum_{n=1}^\infty(\frac{n-1}{n^2})=1 $

Limitar las soluciones de wolframio

Cualquier nacimiento, sea cual sea la familia en la que se produzca, tiene una probabilidad de 50:50 de ser niño o niña

Todo esto tiene un sentido intrínseco porque (por mucho que las parejas lo intenten) no se puede controlar la probabilidad de que un determinado nacimiento sea un niño o una niña. Da igual que un niño nazca en una pareja sin hijos o en una familia de cien niños; la probabilidad es de 50:50, así que si cada nacimiento tiene una probabilidad de 50:50, siempre habrá mitad de niños y mitad de niñas. Y no importa cómo se repartan los nacimientos entre las familias; eso no va a afectar.

Esto funciona para cualquier 1 regla

Ya que debido a la probabilidad de 50:50 para cualquier nacimiento la proporción terminará siendo de 1:1 para cualquier (razonable 1 ) que se te ocurra. Por ejemplo, la siguiente regla similar también funciona incluso

Las parejas dejan de tener hijos cuando tienen una niña, o tienen dos hijos

NumberOfChilden Probability   Girls   Boys
1               0.5           1       0
2               0.25          1       1
2               0.25          0       2

En este caso, el total de hijos esperados es más fácil de calcular

Se espera que las niñas de una pareja ${}=0.5\cdot1 + 0.25\cdot1 =0.75$
Se espera que los niños de una pareja ${}=0.25\cdot1 + 0.25\cdot2 =0.75$

1 Como he dicho, esto funciona para cualquier norma razonable que pueda existir en el mundo real. Una regla irrazonable sería aquella en la que los hijos esperados por pareja fueran infinitos. Por ejemplo, "Los padres sólo dejan de tener hijos cuando tienen el doble de niños que de niñas", podemos utilizar las mismas técnicas anteriores para demostrar que esta regla da infinitos hijos:

NumberOfChilden Probability   Girls   Boys
3               0.125         1       2
6               1/64          2       4
9               1/512         3       6
3*m             1/((3m)^2     m       2m

Podemos entonces encontrar el número de padres con un número finito de hijos

Número previsto de padres con hijos finitos ${}=\sum_{m=1}^\infty(\frac{1}{1/(3m)^2})=\frac{\pi^2}{54}=0.18277\ldots. $

Limitar las soluciones de wolframio

Así pues, podemos establecer que el 82% de los padres tendrían un número infinito de hijos; desde el punto de vista del urbanismo, esto probablemente causaría dificultades y demuestra que esta condición no podría existir en el mundo real.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X