Por favor, ignore los comentarios anteriores - He cambiado radicalmente mi respuesta . Es largo, pero tened paciencia: después de leer esta respuesta, deberíais sentiros intuitivamente cómodos con casi todas las demás falacias probabilísticas, no sólo con ésta.
Lo primero y más importante es definir qué entendemos por "probabilidad". Definamos que significa "el porcentaje esperado de resultados positivos al repetir una observación en una muestra amplia" (Adelante, lee eso de nuevo, más despacio) . Además, vamos a llamar "modelo" al método que utilizamos para elegir esta gran muestra.
Esto puede parecer trivial, pero tiene algunas implicaciones importantes. Por ejemplo, ¿cuál es la probabilidad de morir antes de los 40 años? Según nuestra definición, esta pregunta no tiene sentido: no podemos observar usted varias veces antes de los cuarenta años y registrar cuántas veces usted morir. En su lugar, observamos a otras personas menores de 40 años, y registramos cuántas de ellos morir.
Supongamos que observamos a todas las personas de la Tierra por debajo de los 40 años (nuestro modelo) y descubrimos que la mitad de ellas mueren antes de llegar a los cuatro años. ¿Significa esto que la probabilidad de morir antes de los 40 es del 50%? Pues, según este modelo, sí. Sin embargo, no es un modelo justo. Si revisamos nuestro modelo para incluir sólo a las personas menores de 40 años en los países del primer mundo, las probabilidades se reducen a 1/10. † . ¡Pero tampoco eres fumador, ni vives en la ciudad, y andas en bicicleta los domingos con tu esposa y tu loca suegra, lo que hace que tus posibilidades sean 123/4567! Eso es mucho mejor... sin embargo, nuestro modelo sigue sin tener en cuenta que también eres un ávido paracaidista ;)
† Estoy sacando estas cifras de la nada, no son estadísticas reales.
Así que la cuestión es que pedir una "probabilidad" sólo tiene sentido en el contexto de un determinado modelo, una forma de repetir nuestra observación muchas veces. Sin eso, pedir una probabilidad no tiene sentido.
Ahora, volviendo a la pregunta original. Antes de poder asignar una probabilidad, debemos elegir un modelo; ¿cómo vamos a elegir las familias de las que se tomará la muestra? Veo dos opciones obvias, que conducirán a diferentes respuestas:
- Considere sólo las familias que tienen dos hijos, uno de los cuales es una niña, y elija uno al azar.
- Considere sólo las niñas que tienen exactamente un hermano, y elija uno al azar.
¿Ves la diferencia? En el primer caso, todas las familias tienen la misma probabilidad de ser elegidas. Sin embargo, en el segundo caso, las familias con dos niñas son más que las familias con una sola niña, porque cada chica tiene las mismas posibilidades de ser elegido: las familias con dos niñas han duplicado sus probabilidades al tener dos niñas. Si los niños fueran boletos de la rifa, habrían comprado dos boletos, mientras que las familias de una niña sólo compraron uno.
Por lo tanto, deberíamos esperar que las probabilidades en estos dos casos sean diferentes. Calculémoslas con más rigor (escribiendo BG
para significar "nació niño, luego niña):
- Hay tres tipos de familia igualmente probables:
BG
, GB
y GG
( BB
fue eliminado de la consideración, porque no tienen niñas) . Como sólo uno de los tres tiene dos niñas, nuestras posibilidades de tener dos niñas son 1/3 .
- Tenemos las mismas posibilidades que antes, pero ahora
GG
es dos veces más probable que BG
o GB
. Así, las probabilidades son GG: 2/4
, GB: 1/4
y BG: 1/4
, lo que significa que la probabilidad de un hermano-niña es de 2/4 = 1/2 (como alternativa, podríamos haber señalado que sólo hay dos posibilidades igualmente probables para el hermano: niño o niña) .
Aquí radica la falacia: el modelo que nuestra intuición supone es el segundo, pero la forma en que está redactado el problema implica fuertemente el primero. Cuando pensamos en términos de "elegir al azar una familia (entre un gran número de familias)", nuestra intuición encaja perfectamente con el resultado.
Veamos otro problema similar
En una familia de dos hijos, en la que el mayor es una niña, ¿cuál es la probabilidad de que ambos sean niñas?
Una vez más, puedo ver dos modelos diferentes y plausibles para observar nuestra muestra aleatoria:
- Considere sólo las familias con dos hijos, el mayor de los cuales es una niña, y elija uno al azar.
- Considere sólo a las chicas que tienen exactamente un hermano (menor), y elija uno al azar.
Así que, una vez más, la pregunta implica fuertemente el primer modelo, aunque se pueden dar argumentos a favor de cualquiera de los dos. Sin embargo, cuando calculamos la probabilidad...
- Lo mismo que antes, pero también hemos eliminado
BG
donde el primer hijo fue un niño. Esto deja sólo dos posibilidades igualmente probables, GB
y GG
. Por lo tanto, las posibilidades son 1/2 .
- También hemos eliminado
BG
de este caso, dejando GB
y GG
. Sin embargo, a diferencia de la pregunta original, GG
ya no es el doble de probable, puesto que el hijo menor ya no puede ser el elegido al azar. Por lo tanto, GB
y GG
son igualmente probables, y volvemos a tener una probabilidad de 1/2 (como alternativa, podríamos haber señalado que sólo hay dos posibilidades igualmente probables para el hermano: niño o niña) .
...encontramos que la elección entre estos dos modelos no importa, ¡porque en este caso ambos tienen la misma probabilidad! Entre las familias de dos hijos con una hija mayor, no importa si elegimos al azar la familia o la hija mayor, porque en ambos casos sólo hay uno de cada por familia.
Espero que todo esto tenga sentido. Para obtener puntos extra, intenta aplicar este razonamiento al problema de Monty Hall. ¿Cuál es nuestro modelo, cómo hacemos las observaciones repetidas? ¿Por qué choca con nuestra intuición?
Incluso para más puntos de bonificación, intente resolver la siguiente pregunta; las matemáticas no son demasiado difíciles, pero me llevó mucho tiempo averiguar por qué, intuitivamente, la respuesta debería ser correcta:
En una familia con dos hijos, uno de los cuales es una niña llamada Florida, ¿cuál es la probabilidad de que haya dos niñas?
(Si tienes problemas, publica una pregunta y deja un enlace a ella en los comentarios, e intentaré responderla allí lo mejor que pueda :) )
7 votos
En tu caso "obvio", no cuentas el caso en el que el primer hijo es un niño pero el segundo es una niña.
4 votos
@Rawling Digamos que visito a esta familia. Sé que tienen dos hijos. Uno de ellos, una niña, entra en la habitación. La probabilidad de que el segundo hijo sea también una niña es 1/2, ¿no? O digamos que mi mujer y yo tenemos nuestro primer hijo, una niña. La probabilidad de que el siguiente hijo que tengamos sea también una niña es 1/2, ¿no?
3 votos
En el segundo caso, sí; en el primero, creo que la respuesta también es sí (dado que uno de los dos niños camina con igual probabilidad). Echa un vistazo a es.wikipedia.org/wiki/Boy_or_Girl_paradox
0 votos
Véase también: math.stackexchange.com/questions/4400/
2 votos
Así que reordena la pregunta: "en una familia con dos hijos, de los cuales al menos uno es una niña, ¿qué posibilidades hay de que el otro sea también una niña?" y la respuesta de 1 de cada 3 podría tener un poco más de sentido.
0 votos
@NotSuper: He editado bastante mi respuesta; aunque es muy larga, espero que aclare las cosas.
0 votos
Todas las respuestas aquí son erróneas, porque utilizan la suposición no declarada y errónea de que las distribuciones de género de varios hijos en la misma familia son independientes.
0 votos
Estrechamente relacionada con esta cuestión está una técnica para generar números aleatorios con una función de densidad de probabilidad arbitraria: La aceptación-rechazo de Von Neumann.