Por favor, ignora los comentarios antiguos: he cambiado radicalmente mi respuesta. Es largo, pero aguanta conmigo - después de leer esta respuesta, deberías sentirte intuitivamente cómodo con casi todas las demás falacias probabilísticas, no solo esta.
Lo primero y más importante es definir lo que queremos decir con "probabilidad". Vamos a definirlo como "el porcentaje esperado de resultados positivos al repetir una observación sobre una muestra grande" (Adelante, léelo de nuevo, más despacio). Además, llamemos al método que usamos para elegir esta muestra grande el "modelo".
Esto puede sonar trivial, pero tiene algunas implicaciones importantes. Por ejemplo, ¿cuál es la probabilidad de que mueras antes de los 40 años? Según nuestra definición, esta pregunta no tiene sentido: no podemos observarte múltiples veces antes de los cuarenta años y registrar cuántas veces mueres. En cambio, observamos a otras personas menores de 40 años, y registramos cuántas de ellas mueren.
Así que digamos que observamos a todas las demás personas en la tierra menores de 40 años (nuestro modelo), y encontramos que la mitad de ellas mueren antes de cumplir los cuarenta. ¿Significa esto que la probabilidad de que mueras antes de los 40 es del 50%? Bueno, ¡según este modelo, lo es! Sin embargo, este no es un modelo justo. Quizás vives en un país del primer mundo - ahora cuando revisamos nuestro modelo para incluir solo a personas menores de 40 en países del primer mundo, tus probabilidades se convierten en un mucho menos sombrío 1/10†. Pero tú tampoco eres fumador, no vives en la ciudad, y andas en bicicleta los domingos con tu esposa y tu suegra loca, ¡lo que hace que tus posibilidades sean de 123/4567! Mucho mejor... sin embargo, nuestro modelo todavía no tiene en cuenta que también eres un paracaidista ávido ;)
† Estoy sacando estos números de la nada, no son estadísticas reales.
Entonces, el punto es, pedir una "probabilidad" solo tiene sentido en el contexto de un cierto modelo - una forma de repetir nuestra observación muchas veces. Sin eso, pedir una probabilidad carece de significado.
Ahora, volvamos a la pregunta original. Antes de poder asignar una probabilidad, debemos elegir un modelo; ¿cómo estamos eligiendo las familias a partir de las cuales se toma la muestra? Veo dos opciones obvias, que conducirán a respuestas diferentes:
- Considerar solo familias que tienen dos hijos, uno de los cuales es una niña, y elegir uno al azar.
- Considerar solo niñas que tienen exactamente un hermano/a, y elegir uno al azar.
¿Ves la diferencia? En el primer caso, cada familia tiene la misma probabilidad de ser elegida. Sin embargo, en el segundo caso, las familias con dos niñas son más propensas a ser elegidas que las familias con solo una niña, porque cada niña tiene la misma probabilidad de ser elegida: las familias con dos niñas han duplicado sus posibilidades al tener dos niñas. Si los niños fueran boletos de rifa, habrían comprado dos boletos mientras que las familias con una niña compraron solo uno.
Por lo tanto, deberíamos esperar que las probabilidades en estos dos casos sean diferentes. Calculemoslas de manera más rigurosa (escribiendo BG
para significar "nació un niño, luego una niña"):
- Hay tres tipos de familias igualmente probables:
BG
, GB
y GG
(BB
se eliminó de la consideración, porque no tienen niñas). Dado que solo una de las tres tiene dos niñas, nuestras posibilidades de tener dos niñas son 1/3.
- Tenemos las mismas posibilidades que antes, pero ahora
GG
es dos veces más probable que BG
o GB
. Por lo tanto, las probabilidades son GG: 2/4
, GB: 1/4
y BG: 1/4
, lo que significa que la probabilidad de tener una hermana es de 2/4 = 1/2 (alternativamente, podríamos haber notado que solo hay dos posibilidades igualmente probables para el hermano/a: niño o niña).
Aquí yace la falacia: la intuición asume que nuestro modelo es el segundo, pero la forma en que se formula el problema sugiere fuertemente el primero. Cuando pensamos en términos de "elegir aleatoriamente una familia (entre un gran número de familias)", nuestra intuición encaja perfectamente con el resultado.
Veamos otro problema similar
En una familia de dos hijos, donde el hijo mayor es una niña, ¿cuál es la probabilidad de que ambos sean niñas?
Una vez más, puedo ver dos modelos diferentes y plausibles para observar nuestra muestra aleatoria:
- Considerar solo familias con dos hijos, el mayor de los cuales es una niña, y elegir uno al azar.
- Considerar solo niñas que tienen exactamente un (hermano/a menor), y elegir uno al azar.
Entonces una vez más, la pregunta sugiere fuertemente el primer modelo, aunque se podrían hacer argumentos a favor de cualquiera. Sin embargo, cuando realmente calculamos la probabilidad...
- Igual que antes, pero también hemos eliminado
BG
, donde el primer hijo/a era un niño. Esto deja solo dos posibilidades igualmente probables, GB
y GG
. Así, las posibilidades son 1/2.
- También hemos eliminado
BG
de este caso, dejando GB
y GG
. Sin embargo, a diferencia de la pregunta original, GG
ya no es dos veces más probable, ya que el hijo/a menor ya no puede ser el que se eligió aleatoriamente. Por lo tanto, GB
y GG
son igualmente probables, y nuevamente tenemos una probabilidad de 1/2 (alternativamente, podríamos haber notado que solo hay dos posibilidades igualmente probables para el hermano/a: niño o niña).
...descubrimos que la elección entre estos dos modelos no importa, ¡porque en este caso ambos tienen la misma probabilidad! Entre las familias de dos hijos con una hija mayor, no importa si elegimos aleatoriamente la familia o a la hija mayor, porque en ambos casos hay solo uno de cada uno por familia.
Espero que todo haya tenido sentido. Para puntos extra, intenta aplicar este razonamiento al problema de Monty Hall. ¿Cuál es nuestro modelo - cómo estamos haciendo observaciones repetidas? ¿Por qué choca con nuestra intuición?
Para aún más puntos extra, intenta averiguar la siguiente pregunta; las matemáticas no son demasiado difíciles, pero me llevó mucho tiempo descubrir por qué, intuitivamente, la respuesta debería ser correcta:
En una familia de dos hijos, uno de los cuales es una niña llamada Florida, ¿cuáles son las posibilidades de que ambos sean niñas?
(Si tienes problemas, publica una pregunta y deja un enlace en los comentarios, y trataré de responderla lo mejor que pueda :) )
7 votos
En su caso "obvio", no cuenta el caso donde el primer hijo es un niño pero el segundo hijo es una niña.
4 votos
@Rawling Digo yo visitar esta familia. Sé que tienen 2 hijos. Uno de ellos, una niña, entra en la habitación. ¿La probabilidad de que el segundo niño también sea una niña es 1/2, no? ¿O digamos que mi esposa y yo tenemos nuestro primer hijo, una niña. La probabilidad de que el próximo hijo que tengamos también sea una niña es 1/2, ¿no?
3 votos
En el segundo caso, sí; en el primer caso, creo que la respuesta también es sí (dado que uno de los dos niños camina con igual probabilidad). Echa un vistazo a en.wikipedia.org/wiki/Boy_or_Girl_paradox
0 votos
Ver también: math.stackexchange.com/questions/4400/…
2 votos
Entonces, reordena la pregunta - "en una familia con dos hijos, al menos uno de los cuales es una niña, ¿cuáles son las posibilidades de que el otro también sea una niña?" y la respuesta de 1 en 3 podría tener un poco más de sentido.
0 votos
@NotSuper: He realizado ediciones considerable a mi respuesta; aunque es muy larga, espero que aclare las cosas.
0 votos
Cada respuesta aquí está equivocada, porque utiliza la suposición no declarada y defectuosa de que las distribuciones de género de varios niños en la misma familia son independientes.
0 votos
Estrechamente relacionada con esta pregunta está una técnica para generar números aleatorios con una función de densidad de probabilidad arbitraria: aceptación-rechazo de Von Neumann.