36 votos

Monty Hall Problema con cinco puertas

Hace unos días, mi clase de matemáticas repasó el problema original de Monty Hall y, a continuación, examinó una pregunta relacionada en la que el número de puertas se aumentaba a cinco. Nos costó averiguar cuál era la respuesta al problema y, después de volver sobre él unas cuantas veces más, seguimos sin tenerlo claro.

En este problema ampliado, supongamos que eliges la puerta A de entre las puertas A, B, C, D y E. A continuación, el presentador abre una de las otras puertas para mostrar que está vacía y te da a elegir entre quedarte o cambiar a una de las otras puertas restantes. a) Si te quedas siempre con la puerta que has elegido, ¿cuál es la probabilidad de ganar? b) Si siempre cambias a otra puerta, ¿cuál es la probabilidad de ganar?

Ten en cuenta que el anfitrión sólo abrirá una puerta. Todos los problemas extendidos de Monty Hall que encontré en Internet hacían que el anfitrión abriera todas las puertas menos una, así que no eran realmente útiles para este problema concreto en el que está trabajando mi clase.

He calculado que las probabilidades son de 1/4 independientemente de si cambias o no, ya que el anfitrión que abre sólo una puerta vacía no es suficiente para afectar realmente a la diferencia de porcentajes de victorias entre quedarse y cambiar. ¿Es correcto?

EDIT: Perdón por la confusión por no haber sido lo suficientemente claro. El problema que traigo es de hecho ising los mismos principios básicos que el original: el anfitrión siempre se abrirá una puerta después de elegir uno para mostrar que está vacío, y luego se le da a elegir. La razón por la que llegué a 1/4 es porque estaba viendo la situación calculando de cuántas maneras puedes ganar/perder dependiendo de dónde esté el premio después de que el anfitrión abra una puerta vacía así como a qué puerta cambiaste, lo que me dio 3/12 por cada cambio o 1/4 (o juntándolo todo obtuve 12/48). No llegamos lo suficientemente lejos en las lecciones para aprender más sobre el cálculo de probabilidades con condiciones, así que pido disculpas si eso fue lo que me llevó a un cálculo falso. Gracias a todos por las respuestas.

6voto

Terry Phan Puntos 36

Creo que el problema está mal definido en su forma actual. La respuesta a la segunda pregunta ( es decir la probabilidad de ganar al cambiar) depende de (1) qué política de apertura de puertas utiliza el anfitrión; y (2) qué política de cambio utiliza el jugador.


Si se supone implícitamente que el jugador selecciona al azar con igual probabilidad de $1/3$ de las otras tres puertas sin abrir al considerar el cambio, entonces la probabilidad de ganar es $4/15$ En efecto, como han señalado otros encuestados. Esto es así independientemente de cómo el anfitrión elija qué puerta abrir.


Sin embargo, considere el siguiente escenario. Sin pérdida de generalidad, supongamos que el jugador elige puerta $A$ . El host utiliza la siguiente política de apertura de puertas:

  • Si el premio está en $B$ puerta abierta $C$ .
  • Si el premio está en $A$ , $C$ , $D$ o $E$ puerta abierta $B$ .

El jugador utiliza la siguiente política de conmutación:

  • Si $B$ es abierto por el host, pasa de $A$ a $C$ ;
  • Si el anfitrión abre cualquier otra puerta, pasa de $A$ a $B$ .

Dada la política de apertura de puertas del anfitrión, existen cinco estados relevantes del mundo, cada uno de los cuales ocurre con probabilidad $1/5$ :

  • El premio está en $A$ el anfitrión abrió $B$ .
  • El premio está en $B$ el anfitrión abrió $C$ .
  • El premio está en $C$ el anfitrión abrió $B$ .
  • El premio está en $D$ el anfitrión abrió $B$ .
  • El premio está en $E$ el anfitrión abrió $B$ .

Al utilizar la política de cambio especificada anteriormente, el jugador gana el premio al cambiar en el segundo y el tercero de los cinco estados. Por lo tanto, la probabilidad de ganar al cambiar es $2/5>4/15$ .

Por lo tanto, la respuesta depende de cómo el anfitrión elija qué puerta abrir y de cómo el jugador elija a qué puerta no abierta cambiar. Esto se debe a que el jugador puede deducir cierta información adicional de la política concreta de apertura de puertas que utiliza el anfitrión. En el ejemplo anterior, si el jugador conoce la política que utiliza el anfitrión, puede seguro que el premio está detrás de la puerta $B$ al observar la puerta $C$ ¡habiendo sido abierto! Esta información adicional mejora las posibilidades del jugador de ganar el premio al cambiar.


Obsérvese que esta complicación no se plantea en el problema básico de Monty Hall con sólo tres puertas. Si el jugador selecciona $A$ (de nuevo, sin pérdida de generalidad), entonces el anfitrión puede elegir qué puerta abrir sólo si el premio está en $A$ . Sin embargo, esto es irrelevante, ya que en este caso el jugador seguramente pierde al cambiar. Por lo tanto, si el premio está en $A$ (probabilidad $1/3$ ), entonces la jugadora pierde si cambia (independientemente de qué otra puerta abra el anfitrión) y si el premio está en cualquiera de los dos $B$ o $C$ (probabilidad $2/3$ ), entonces el jugador seguramente gana si cambia (ya que el anfitrión está obligado a dejar la puerta ganadora sin abrir).

En consecuencia, cualquier información adicional que pueda contener la política de apertura de puertas del anfitrión es inútil para el jugador que se plantea a qué puerta cambiar (condicionado a que haya decidido cambiar). Si el premio está detrás de $A$ entonces no ganará de todos modos al cambiar, y ninguna información adicional puede ayudar a esto. Si el premio está detrás de $B$ o $C$ por otro lado, entonces ganará aunque la política de apertura de puertas del anfitrión no revele subrepticiamente ninguna información extra.

Con cinco puertas, sin embargo, los detalles específicos de cómo las puertas no ganadoras son abiertas por el anfitrión y cómo las puertas no abiertas son seleccionadas por el jugador do ¡Importa!


De hecho, si al anfitrión le gusta mucho el jugador, puede asegurarse de que gane con probabilidad $4/5$ ¡al cambiar! Para ver esto, supongamos que el anfitrión utiliza la siguiente política (de nuevo, wlog, supongamos que el jugador ha elegido $A$ ):

  • Si el premio está en $A$ o $B$ abierto $C$ .
  • Si el premio está en $C$ abierto $D$ .
  • Si el premio está en $D$ abierto $E$ .
  • Si el premio está en $E$ abierto $B$ .

Puede comprobar fácilmente que el jugador ganará con probabilidad $4/5$ si utiliza la siguiente política:

  • Si $B$ se abre, cambia a $E$ .
  • Si $C$ se abre, cambia a $B$ .
  • Si $D$ se abre, cambia a $C$ .
  • Si $E$ se abre, cambia a $D$ .

Esto se debe a que si el jugador conoce la política del anfitrión, entonces éste básicamente le está "diciendo" al jugador dónde está el premio, siempre y cuando no esté en $A$ .

2voto

Jason Weathered Puntos 5346

Los supuestos estándar son:

  1. el premio tiene las mismas probabilidades de estar detrás de cualquier puerta;
  2. Monte nunca abre la puerta que elegiste;
  3. Monte nunca abre la puerta con el premio;
  4. Monte elige al azar entre el resto de puertas disponibles.

Supongamos que eliges la puerta A y Monte abre la puerta B. Queremos calcular $$ \Pr[\text{prize behind door A}\mid\text{Monty opens door B}]. $$ Usando los supuestos, resolvemos usando un árbol de probabilidad. La etapa 1 del árbol representará la posición real del premio, con tres opciones: puerta A, puerta B, o una de las puertas C, D, E.

La fase 2 del árbol representará la acción de Monte, con dos opciones: Monty abre la puerta B o Monty abre una de las puertas C, D, E. Si el premio está detrás de A, Monty abre la puerta B con probabilidad 1/4 y una de C, D, E con probabilidad 3/4. Si el premio está detrás de la puerta B, Monty abre la puerta B con probabilidad 0 y una de C, D, E con probabilidad 1. Si el premio está detrás de una de C, D, E, Monty abre la puerta B con probabilidad 1/3 y una de C, D, E con probabilidad 2/3.

Utilizando la fórmula de Bayes, obtenemos $$ \Pr[\text{prize behind door A}\mid\text{Monty opens door B}]=\frac{\frac{1}{5}\cdot\frac{1}{4}}{\frac{1}{5}\cdot\frac{1}{4}+\frac{1}{5}\cdot0+\frac{3}{5}\cdot\frac{1}{3}}=\frac{1}{5}. $$

1voto

David K Puntos 19172

Porque había una queja sobre la falta de un tratamiento matemático, y porque este problema se reduce a los mismos principios matemáticos que la mayoría de los problemas extendidos de Monty Hall, he aquí un tratamiento generalizado.

La configuración general es que hay $n$ puertas, y hay un valioso premio detrás de exactamente una puerta (la "puerta del premio"), cuya identidad desconoce. Inicialmente, elige una puerta. Con una probabilidad distinta de cero $p$ (que es independiente de si ha elegido la puerta con el premio inicialmente), el anfitrión abrirá entonces $m$ puertas, $m \leq n - 2,$ donde ni tu puerta inicialmente elegida ni la puerta del premio (si es diferente) pueden ser una de las $m$ puertas.

Para Monty Hall estándar, $n=3,$ $p=1,$ y $m=1.$ Para su variante, $n=5,$ $p=1,$ y $m=1.$

El punto clave a recordar es que la acción del anfitrión es independiente de si usted inicialmente eligió la puerta del premio. Es decir, si $A$ es el caso de que su primer elección es la puerta del premio, y $B$ es el caso de que el anfitrión abra $m$ puertas (sin incluir la tuya y sin incluir la puerta del premio), entonces $$P(B|A) = P(B|A^\complement) = P(B) = p.$$

Supongamos ahora que estás jugando y el anfitrión acaba de abrir el $m$ puertas, es decir, usted acaba de observar acontecimiento $B.$ Nos preguntamos, ¿cuál es ahora la probabilidad de $A$ (es decir, la probabilidad de que el coche esté detrás de la puerta elegida inicialmente), dado que hemos observado $B$ ? Es decir, ¿qué es $P(A|B)$ ? Aplicando el Teorema de Bayes, encontramos que $$P(A|B) = \frac{P(B|A)P(A)}{P(B)} = P(A),$$ desde $\frac{P(B|A)}{P(B)} = 1.$ Es decir, la probabilidad de que ya haya elegido la puerta premiada es exactamente la misma después de la acción del anfitrión que antes de la acción del anfitrión.

En otras palabras, todos los que te dijeron algo equivalente a eso última frase te estaba diciendo la verdad.

En Monty Hall estándar que deja un $\frac 13$ probabilidad de que su primera suposición fuera correcta; en su extensión la probabilidad es $\frac 15,$ dejando un $\frac 45$ probabilidad de que el premio esté detrás de uno de los otros tres puertas sin abrir.

0voto

Layke Puntos 10216

Hay dos casos límite: el primero (1), en el que en cada "suceso" Monte Hall abre la puerta con menor probabilidad, y el segundo (2), en el que en cada "suceso" Monte Hall abre la puerta con mayor probabilidad. Esto excluye cualquier puerta que el participante haya "seleccionado", por lo que la distribución de probabilidad sobre esa puerta en particular no cambia en cada "suceso". Al igual que en el problema clásico de Monte Hall con tres puertas, es lógico cambiar de puerta después de cada "suceso" de apertura. He ilustrado el primer caso límite, que llamaré "Escenario 1".

An example of one limiting case of a five door Monte Hall Problem in which Monte chooses a door with the least portion of the probability distribution function

Observe que después de cada "suceso", la suma sobre las particiones de la función de distribución de probabilidad es la unidad, es decir, al principio, 1/5 + 1/5 + 1/5 + 1/5 + 1/5 = 1. Y después del tercer suceso de apertura de la puerta, 0 + 0 + 6/15 + 0 + 9/15 = 1.

0voto

user486185 Puntos 1

Hace poco escribí un código que simula el Problema de Monty Hall con n número de puertas y cualquier distribución de probabilidad para cada etapa del escenario. Por ejemplo, se pueden cambiar las probabilidades de qué puerta elige el jugador, en qué puerta se coloca el premio y la puerta que abre Monty. Ejecutando el código con las mismas probabilidades en todas las etapas y con cinco puertas puedo confirmar que la probabilidad de ganar cuando se cambia de puerta es de 4/15 mientras que la probabilidad de ganar cuando se mantiene la elección original es de 1/5.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X