24 votos

Problema de Monty Hall con un Monty faltón

Monty sabía perfectamente si la Puerta tenía una cabra detrás (o estaba vacía). Este hecho permite al jugador duplicar su tasa de éxito a lo largo del tiempo cambiando las "conjeturas" a la otra puerta. ¿Y si el conocimiento de Monty fuera menos que perfecto? ¿Y si a veces el Premio estaba realmente en la misma Puerta que la Cabra? ¿Pero no pudo verlo hasta después de elegir y abrir SU puerta? ¿Puede ayudarme a entender cómo calcular SI - y por cuánto - el jugador puede mejorar su éxito cuando la tasa de precisión de Monty es inferior al 100%? Por ejemplo: ¿qué pasa si Monty se equivoca -en promedio- el 50% de las veces? ¿Puede el jugador seguir beneficiándose de cambiar su Adivina/Puerta? Me imagino que si Monty tiene menos del 33,3% de posibilidades de acertar que el Premio NO está detrás de la Puerta, entonces la mejor opción del Jugador es NO cambiar su elección de Puerta. ¿Puede proporcionarme una forma de calcular el beneficio potencial de cambiar insertando diferentes probabilidades de que Monty esté en lo cierto sobre que el premio NO está detrás de la puerta? No tengo nada más allá de las matemáticas de la Escuela Secundaria, y tengo 69 años, así que por favor sea amable.


Gracias por las ideas y fórmulas aportadas. Parece ser que si "Fallible Monty" es sólo el 66% de precisión en la predicción de la ausencia de un premio / coche que hay CERO beneficio para cambiar de su elección original de las puertas ....porque su tasa de error del 33% es la tasa de base por defecto para el Premio de estar detrás de cualquier puerta. Sin embargo, se supone que si Monty consigue predecir mejor que el 66% cuando no hay premio, entonces el cambio de puerta es más útil. Intentaré aplicar este razonamiento a un juego en el que un "Experto" hace una "predicción experta" de que una de las tres opciones aproximadamente igual de probables será la correcta. Tengo poca fe en que el experto acierte, y estoy bastante seguro de que su "tasa de aciertos" será inferior al 33%, más bien el 15%. Mi conclusión será que cuando el "Experto" elija una opción diferente a la mía, será beneficioso para mí cambiar mi elección a la otra opción. Y, cuando el Experto elige la mismo opción como yo, probablemente me equivoco seguro, y debería cambiar a una de las otras dos! ;-)

35voto

Johnny Puntos 151

Empecemos con el problema habitual de Monty Hall. Tres puertas, detrás de una de las cuales hay un coche. Las otras dos tienen cabras detrás. Eliges la puerta número 1 y Monty abre la puerta número 2 para mostrarte que hay una cabra detrás de ella. ¿Debes cambiar tu elección por la puerta número 3? (Ten en cuenta que los números que usamos para referirnos a cada puerta no importan aquí. Podríamos elegir cualquier orden y el problema es el mismo, así que para simplificar las cosas podemos utilizar simplemente esta numeración).

La respuesta, por supuesto, es sí, como ya sabes, pero vamos a repasar los cálculos para ver cómo cambian después. Dejemos que $C$ sea el índice de la puerta con el coche y $M$ denotan el hecho de que Monty reveló que la puerta 2 tiene una cabra. Tenemos que calcular $p(C=3|M)$ . Si esto es mayor que $1/2$ Si no hay una puerta, tenemos que cambiar nuestra conjetura a esa puerta (ya que sólo tenemos dos opciones restantes). Esta probabilidad viene dada por: $$ p(C=3|M)=\frac{p(M|C=3)}{p(M|C=1)+p(M|C=2)+p(M|C=3)} $$ (Esto no es más que aplicar la regla de Bayes con un prior plano sobre $C$ .) $p(M|C=3)$ igualdades 1: si el coche está detrás de la puerta número 3, entonces Monty no tuvo más remedio que abrir la puerta número 2 como hizo. $p(M|C=1)$ es igual a $1/2$ Si el coche está detrás de la puerta 1, entonces Monty tenía la opción de abrir una de las puertas restantes, la 2 o la 3. $p(M|C=2)$ es igual a 0, porque Monty nunca abre la puerta que sabe que tiene el coche. Llenando estos números, obtenemos: $$ p(C=3|M)=\frac{1}{0.5+0+1}=\frac{2}{3} $$ Que es el resultado que conocemos.

Ahora consideremos el caso en el que Monty no tiene un conocimiento perfecto de qué puerta tiene el coche. Así, cuando elige su puerta (a la que nos referiremos como puerta número 2), puede elegir accidentalmente la que tiene el coche, porque cree que tiene una cabra. Dejemos que $C'$ sea la puerta que Monty piensa tiene el coche, y deja que $p(C'|C)$ sea la probabilidad de que piense que el coche está en un lugar determinado, condicionada a su ubicación real. Supondremos que esto se describe con un único parámetro $q$ que determina su precisión, tal que: $p(C'=x|C=x) = q = 1-p(C'\neq x|C=x)$ . Si $q$ es igual a 1, Monty siempre tiene razón. Si $q$ es 0, Monty siempre se equivoca (lo cual sigue siendo informativo). Si $q$ es $1/3$ la información de Monty no es mejor que una suposición al azar.

Esto significa que ahora tenemos: $$p(M|C=3) = \sum_x p(M|C'=x)p(C'=x|C=3)$$ $$= p(M|C'=1)p(C'=1|C=3) + p(M|C'=2)p(C'=2|C=3) + p(M|C'=3)p(C'=3|C=3)$$ $$= \frac{1}{2} \times \frac{1}{2}(1-q) + 0\times \frac{1}{2}(1-q) + 1 \times q$$ $$= \frac{1}{4} - \frac{q}{4} + q = \frac{3}{4}q+\frac{1}{4}$$

Es decir, si el coche estaba realmente detrás de la puerta 3, había tres posibilidades que podían haberse dado: (1) Monty pensó que estaba detrás de la 1, (2) Monty pensó en la 2 o (3) Monty pensó en la 3. La última opción se da con probabilidad $q$ (la frecuencia con la que acierta), los otros dos dividen la probabilidad de que se equivoque $(1-q)$ entre ellos. Entonces, dado cada escenario, ¿cuál es la probabilidad de que hubiera elegido apuntar a la puerta número 2, como hizo? Si pensaba que el coche estaba detrás de la 1, esa probabilidad era de 1 entre 2, ya que podría haber elegido la 2 o la 3. Si pensaba que estaba detrás de la 2, nunca habría elegido señalar la 2. Si pensaba que estaba detrás de la 3, siempre habría elegido la 2.

Podemos calcular de forma similar las probabilidades restantes: $$p(M|C=1) = \sum_x p(M|C'=x)p(C'=x|C=1)$$ $$=\frac{1}{2}\times q + 1\times \frac{1}{2}(1-q)$$ $$=\frac{q}{2}+\frac{1}{2}-\frac{q}{2}=\frac{1}{2}$$

$$p(M|C=2) = \sum_x p(M|C'=x)p(C'=x|C=2)$$ $$=\frac{1}{2}\times\frac{1}{2}(1-q) + 1 \times\frac{1}{2}(1-q)$$ $$=\frac{3}{4}-\frac{3}{4}q$$

Completando todo esto, tenemos: $$ p(C=3|M)=\frac{\frac{3}{4}q+\frac{1}{4}}{\frac{1}{2}+\frac{3}{4}-\frac{3}{4}q+\frac{3}{4}q+\frac{1}{4}} $$ $$ =\frac{0.75q+0.25}{1.5} $$ Como comprobación de cordura, cuando $q=1$ podemos ver que recuperamos nuestra respuesta original de $\frac{1}{1.5}=\frac{2}{3}$ .

Entonces, ¿cuándo debemos cambiar? Asumiré para simplificar que no se nos permite cambiar a la puerta que señaló Monty. Y de hecho, siempre que Monty tenga al menos alguna probabilidad de acertar (más que la de adivinar al azar), la puerta que señale siempre tendrá menos probabilidades que las otras de tener el coche, por lo que esta no es una opción viable para nosotros de todos modos. Así que sólo tenemos que considerar las probabilidades de las puertas 1 y 3. Pero mientras que antes era imposible que el coche estuviera detrás de la puerta 2, ahora esta opción tiene una probabilidad distinta de cero, por lo que ya no debemos cambiar cuando $p(C=3|M)>0.5$ sino que debemos cambiar cuando $p(C=3|M)>p(C=1|M)$ (que solía ser lo mismo). Esta probabilidad viene dada por $p(C=1|M)=\frac{0.5}{1.5}=\frac{1}{3}$ , igual que en el problema original de Monty Hall. (Esto tiene sentido, ya que Monty nunca puede apuntar hacia la puerta 1, independientemente de lo que haya detrás, y por lo tanto no puede proporcionar información sobre esa puerta. Más bien, cuando su precisión cae por debajo del 100%, el efecto es que se "filtra" alguna probabilidad hacia la puerta 2 que realmente tiene el coche). Por lo tanto, tenemos que encontrar $q$ tal que $p(C=3|M) > \frac{1}{3}$ : $$\frac{0.75q+0.25}{1.5}>\frac{1}{3}$$ $$0.75q+0.25 > 0.5$$ $$0.75q > 0.25$$ $$q > \frac{1}{3}$$ Así que, básicamente, esta fue una manera muy larga de averiguar que, siempre que el conocimiento de Monty sobre la verdadera ubicación del coche es mejor que una conjetura al azar, usted debe cambiar las puertas (que es en realidad un poco obvio, cuando se piensa en ello). También podemos calcular cuánto más probable es que ganemos cuando cambiamos, en función de la precisión de Monty, ya que esto viene dado por: $$\frac{p(C=3|M)}{p(C=1|M)}$$ $$=\frac{\frac{0.75q+0.25}{1.5}}{\frac{1}{3}}=1.5q+0.5$$ (Que, cuando $q=1$ , da una respuesta de 2, coincidiendo con el hecho de que duplicamos nuestras posibilidades de ganar cambiando de puerta en el problema original de Monty Hall).

Edición: La gente estaba preguntando por el escenario en el que se nos permite cambiar a la puerta que señala Monty, que se convierte en una ventaja cuando $q<\frac{1}{3}$ es decir, cuando Monty es un "mentiroso" (algo) fiable. En el caso más extremo, cuando $q=0$ Esto significa que la puerta que Monty cree que tiene el coche en realidad tiene una cabra. Tenga en cuenta, sin embargo, que las dos puertas restantes todavía podría tener un coche o una cabra.

El beneficio de cambiar a la puerta 2 viene dado por: $$ \frac{p(C=2|M)}{p(C=1|M)} = \frac{ \frac{0.75 - 0.75q}{1.5} } { \frac{1}{3} } = 1.5-1.5q $$ Que sólo es mayor que 1 (y por lo tanto vale la pena cambiar a esa puerta) si $1.5q<0.5$ es decir, si $q<\frac{1}{3}$ que ya establecimos que era el punto de inflexión. Curiosamente, el máximo beneficio posible para cambiar a la puerta 2, cuando $q=0$ es sólo 1,5, en comparación con la duplicación de sus probabilidades de ganar en el problema original de Monty Hall (cuando $q=1$ ).

La solución general viene dada por la combinación de estas dos estrategias de conmutación: cuando $q>\frac{1}{3}$ Siempre se pasa a la puerta 3; en caso contrario, se pasa a la puerta 2.

7voto

Aaron Puntos 36

Esto debería ser una variación bastante sencilla del problema (aunque observo tu limitada formación matemática, así que supongo que eso es relativo). Te sugiero que primero intentes determinar la solución con la condición de si Monte es infalible, o totalmente falible. El primer caso es simplemente el problema ordinario de Monte Hall, así que no hay que trabajar en él. En el segundo caso, se trataría la puerta que elige como aleatoria sobre todas las puertas, incluida la puerta con el premio (es decir, podría seguir eligiendo una puerta sin premio, pero ahora es aleatoria). Si se puede calcular la probabilidad de ganar en cada uno de estos casos, se puede utilizar el método ley de la probabilidad total para determinar las probabilidades de victoria relevantes en el caso de que Monte tenga algún nivel especificado de falibilidad (especificado por una probabilidad de que seamos infalibles frente a totalmente falibles).

4voto

Francisco Noriega Puntos 111

Basándome en los comentarios de la respuesta de Ben, voy a ofrecer dos interpretaciones diferentes de esta variante de Monty Hall, diferentes a la de Ruben van Bergen.

Al primero lo voy a llamar Monty Mentiroso y al segundo Monty No Fiable. En ambas versiones el problema procede como sigue:

(0) Hay tres puertas, detrás de una de las cuales hay un coche y detrás de las otras dos hay cabras, distribuidas al azar.

(1) El concursante elige una puerta al azar.

(2) Monty elige una puerta diferente a la del concursante y afirma que detrás de ella hay una cabra.

(3) Se ofrece al concursante cambiar a la tercera puerta no elegida, y el problema es "¿Cuándo debe cambiar el concursante para maximizar la probabilidad de encontrar un coche detrás de la puerta?"

En Liar Monty, en el paso (2), si el concursante ha elegido una puerta que contenga una cabra, entonces Monty elige una puerta que contenga el coche con alguna probabilidad predefinida (es decir, hay una probabilidad entre 0 y 100% de que mienta que hay una cabra detrás de alguna puerta). Nótese que en esta variante, Monty nunca elige una puerta que contenga el coche (es decir, no puede mentir) si el concursante eligió el coche en el paso (1).

En Unreliable Monty, hay una probabilidad predefinida de que la puerta que elige Monty en el paso (2) contenga un coche. De tu comentario a la respuesta de Ben deduzco que este es el escenario que te interesa, y mis dos versiones difieren de la de Ruben van Bergen. Ten en cuenta que Monty no fiable no es lo mismo que Monty mentiroso; más adelante diferenciaremos rigurosamente estos dos casos. Pero considere esto, en este escenario, la puerta de Monty nunca puede contener el coche más de $\frac{2}{3}$ del tiempo, ya que el concursante tiene una probabilidad de elegir el coche $\frac{1}{3}$ del tiempo.

Para responder al problema, vamos a tener que utilizar algunas ecuaciones. Voy a intentar formular mi respuesta de forma que sea accesible. Las dos cosas que espero que no sean demasiado confusas son la manipulación algebraica de símbolos y la probabilidad condicional. Para la primera, utilizaremos símbolos para denotar lo siguiente:

$$\begin{split} S &= \text{The car is behind the door the contestant can switch to.}\\ \bar{S} &= \text{The car is not behind the door the contestant can switch to.}\\ M &= \text{The car is behind the door Monty chose.}\\ \bar{M} &= \text{The car is not behind the door Monty chose.}\\ C &= \text{The car is behind the door the contestant chose in step (1).}\\ \bar{C} &= \text{The car is not behind the door the contestant chose in step (1).} \end{split} $$

Utilizamos $\Pr(*)$ para denotar "la probabilidad de $*$ ", por lo que, en conjunto, algo como $\Pr(\bar{M})$ significa la probabilidad de que el coche no esté detrás de la puerta que Monty eligió. (Es decir, siempre que veas una expresión en la que intervienen los símbolos, sustitúyelos por los equivalentes "ingleses").

También necesitaremos una comprensión rudimentaria de la probabilidad condicional, que es, a grandes rasgos, la probabilidad de que algo ocurra si se tiene conocimiento de otro suceso relacionado. Esta probabilidad se representará aquí con expresiones como $\Pr(S|\bar{M})$ . La barra vertical $|$ puede pensarse como la expresión "si se sabe", de modo que $\Pr(S|\bar{M})$ puede leerse como "la probabilidad de que la puerta a la que puede cambiar el concursante tenga el coche, si se sabe que el coche no está detrás de la puerta de Monty". En el problema original de Monty Hall, $\Pr(S|\bar{M}) = \frac{2}{3}$ que es mayor que $\Pr(S) = \frac{1}{3}$ que corresponde al caso en que Monty no le ha dado ninguna información.

Ahora demostraré que el Monty no fiable es equivalente al Monty mentiroso. En Liar Monty, se nos da la cantidad $\Pr(M|\bar{C})$ la probabilidad de que Monty mienta sobre su puerta, sabiendo que el concursante no ha elegido el coche. En Unreliable Monty, se nos da la cantidad $\Pr(M)$ la probabilidad de que Monty mienta sobre su puerta. Usando la definición de probabilidad condicional $\Pr(M \text{ and } \bar{C}) = \Pr(\bar{C} | M) \Pr(M) = \Pr(M | \bar{C}) \Pr(\bar{C})$ y reordenando, obtenemos:

$$ \begin{split} \Pr(M) &= \frac{\Pr(M | \bar{C}) \Pr(\bar{C})}{\Pr(\bar{C} | M)}\\ \frac{3}{2} \Pr(M) &= \Pr(M | \bar{C}), \end{split}$$ desde $\Pr(\bar{C})$ la probabilidad de que el coche no esté detrás de la puerta elegida por el concursante es $\frac{2}{3}$ y $\Pr(\bar{C} | M)$ La probabilidad de que el coche no esté detrás de la puerta elegida por el concursante, si sabemos que está detrás de la puerta de Monty, es uno.

Así, hemos mostrado la conexión entre el Monty no fiable (representado por el LHS de la ecuación anterior) y el Monty mentiroso (representado por el RHS). En el caso extremo de Monty no fiable, en el que Monty elige una puerta que esconde el coche $\frac{2}{3}$ del tiempo, esto equivale a que Monty mienta todo el tiempo en Liar Monty, si el concursante ha elegido una cabra originalmente.

Una vez demostrado esto, voy a proporcionar información suficiente para responder a la versión mentirosa del Problema de Monty Hall. Queremos calcular $\Pr(S)$ . Utilizando el ley de la probabilidad total :

$$\begin{split} \Pr(S) &= \Pr(S|C)\Pr(C) + \Pr(S|\bar{C} \text{ and } M)\Pr(\bar{C} \text{ and } M) + \Pr(S|\bar{C} \text{ and } \bar{M})\Pr(\bar{C} \text{ and } \bar{M})\\ &= \Pr(\bar{C} \text{ and } \bar{M}) \end{split}$$ desde $\Pr(S|C) = \Pr(S|\bar{C} \text{ and } M) = 0$ y $\Pr(S|\bar{C} \text{ and } \bar{M}) = 1$ (¡convénzase de ello!).

Continuando:

$$\begin{split} \Pr(S) &= \Pr(\bar{C} \text{ and } \bar{M})\\ &= \Pr(\bar{M} | \bar{C}) \Pr(\bar{C}) \\ &= \frac{2}{3} - \frac{2}{3}\Pr(M | \bar{C})) \end{split}$$

Así que ya ves, cuando Monty siempre miente (aka $\Pr(M | \bar{C})) = 1$ ) entonces tienes cero posibilidades de ganar si siempre cambias, y si nunca miente entonces la probabilidad de que el coche esté detrás de la puerta a la que puedes cambiar, $\Pr(S)$ es $\frac{2}{3}$ .

A partir de esto se pueden elaborar las estrategias óptimas tanto para Liar, como para Unreliable Monty.

Anexo 1

En respuesta al comentario (el énfasis es mío):

"He añadido más detalles en mi comentario a @alex - Monty nunca es hostil ni taimado, sólo FALIBLE, ya que a veces puede equivocarse por cualquier razones, y nunca abre la puerta. La investigación muestra que Monty se equivoca aproximadamente el 33,3% de las veces, y el coche realmente resulta está ahí. Eso es una Probabilidad Posterior de ser correcto el 66,6% de del tiempo, ¿correcto? Monty nunca elige su puerta, y usted nunca elegirá elige la suya . ¿Cambian algo estas suposiciones?"

Este es, según tengo entendido, el problema de Monty Hall no fiable introducido al principio de mi respuesta.

Por lo tanto, si la puerta de Monty contiene el coche $\frac{1}{3}$ de las veces, tenemos la probabilidad de ganar cuando se cambia a la última puerta no elegida como:

$$ \begin{split} \Pr(S) &= \frac{2}{3} - \frac{2}{3}\Pr(M | \bar{C})\\ &= \frac{2}{3} - \frac{2}{3} \times \frac{3}{2}\Pr(M) \\ &= \frac{2}{3} - \frac{1}{3}\\ &= \frac{1}{3} \end{split}$$

Por lo tanto, no hay diferencia entre cambiar, permanecer con la puerta original o, si se permite, cambiar a la puerta elegida por Monty (de acuerdo con su intuición).

0voto

TOM Puntos 141

Por alguna razón, un moderador decidió borrar mi propia respuesta a mi propia pregunta, alegando que contenía "discusión". Realmente no veo cómo puedo explicar cuál es la mejor respuesta sin discutir lo que hace que funcione para mí, y cómo se puede aplicar en la práctica.

Agradezco las ideas y fórmulas que se han aportado en las respuestas anteriores. Parece ser que SI "Fallible Monty" sólo acierta en un 66% en la predicción de la ausencia de un Premio/Carro ENTONCES hay CERO beneficio para cambiar de su elección original de puertas.... porque su tasa de error del 33% es la tasa base por defecto para el Premio que está detrás de CUALQUIER puerta. Sin embargo, se supone que si Monty consigue mejorar el 66% en la predicción de dónde no hay premio, entonces el cambio le reporta una mayor utilidad.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X