9 votos

¿Qué es el equilibrio de Nash del problema de Monty Hall?

La Monty Hall problema o paradoja es famoso y bien estudiado. Pero lo que me confunde acerca de la descripción era una simple suposición.

Supongamos que usted está en una demostración del juego, y tendrás la opción de tres de puertas: detrás de una puerta de un coche; detrás de los otros, de las cabras. Elegir una puerta, decir el Nº 1, y el anfitrión, que sabe lo que hay detrás de las puertas, se abre otra puerta, digamos Nº 3, que tiene una cabra. Él entonces le dice a usted, "¿Usted quiere elegir la puerta Nº 2?" Es a su ventaja para cambiar su elección?

La suposición es que el anfitrión de la demostración no tiene una opción ya sea para ofrecer el interruptor. De hecho, Monty Hall de sí mismo, en respuesta a Steve Selvin la formulación original del problema, señaló que a medida que el host no siempre ofrecen el interruptor.

Debido a que el anfitrión sabe lo que hay detrás de las puertas, sería posible y a su ventaja de ofrecer un interruptor más a menudo a los participantes que adivinen correctamente. Si él sólo se ofrece la cambie a los participantes que adivinen correctamente, todos los participantes que acepten la oferta de perder. Sin embargo, si él hizo esto de forma consistente, el público aprende a no aceptar la oferta y pronto todos los concursantes, el primero que adivine correctamente iba a ganar.

Si, por ejemplo, dio a la oferta de un tercio de las incorrecta guessers y dos tercios de corregir guessers, 2/9 participantes sería dada la oferta y no debe cambiar y 2/9 participantes sería dada la oferta y, lo que elevaría las posibilidades de ganar la espalda a 1/2 si uno acepta la oferta o no, en lugar de 1/3 o 2/3.

Es este un equilibrio de Nash para el Monty Hall problema (o la iterada de Monty Hall problema) como un modo para dos jugadores juego de suma cero? Y si no, ¿qué es, o no hay ninguna?

5voto

Matthew Scouten Puntos 2518

El coche probablemente no salga de la acogida del salario, por lo que probablemente no realmente desea reducir al mínimo la rentabilidad, lo que quiere es maximizar los índices de audiencia del programa. Pero OK, vamos supongamos que él quería minimizar la rentabilidad, haciendo de este un juego de suma cero. A continuación, el valor óptimo del juego (en términos de la probabilidad de ganar el coche) serían $1/3$. Una estrategia óptima para el concursante es que siempre se niegan a cambiar, asegurar que el beneficio esperado es $1/3$. Una estrategia óptima para el host nunca para ofrecer un interruptor, a menos que la concursante de la primera suposición es correcta, asegurándose de que el beneficio esperado es de no más de $1/3$.

3voto

Steve Morgan Puntos 21

Gracias por tu respuesta, Robert. Si el valor óptimo es de 1/3 como se mostró, entonces supongo que debe haber una infinidad de estrategias mixtas que el host podría emplear, lo que estaría en equilibrio. Si, como he mencionado en la pregunta, el anfitrión ofrece el interruptor de 2/3 de corregir guessers y 1/3 de la incorrecta guessers, 1/9 los participantes deberán adivinar correctamente y no se ofrecerá un interruptor, a ganar de inmediato. También, 2/9 será correcta guessers ofrece un interruptor y 2/9 será incorrecta guessers ofrece un interruptor. Por lo tanto 4/9 se ofrecerá un interruptor y 2/9 va a ganar, si lo acepta o no, ya que su valor esperado será de 1/2, si la aceptan, el interruptor o no. El resto de los concursantes pierde inmediatamente.

1/9 + 2/9 = 1/3

Esto significa que el host puede ofrecer cualquier número entre 0 y 2/3 de su concursantes de un interruptor sin cambiar el valor esperado, mientras que el número de corregir guessers e incorrecta guessers ofrece un interruptor es el mismo. Él puede lograr esto fácilmente con una estrategia mixta de una correcta guessers exactamente el doble de probabilidades de recibir una oferta.

Con cualquiera de esta familia de estrategias, entonces el anfitrión no puede garantizar un mejor resultado de 1/3, lo que él ha hecho. Y el concursante tendrá el mismo valor esperado, independientemente de su estrategia, por lo que no puede mejorar. Así, estos también son equilibrios de Nash. Y usted tendría que estar de acuerdo, desde una perspectiva práctica, el anfitrión debe emplear uno de estos altamente estrategias mixtas para que el juego sea más emocionante, sin perjuicio de su línea de fondo. No tengo ninguna evidencia directa, pero me gustaría aventurar una conjetura que este es más o menos lo de Monty Hall en realidad.

Lo sorprendente de esto es que el ingenuo respuesta a los clásicos de Monty Hall problema, "No, no hay ningún beneficio," (50/50) pueden ser correctas, bajo supuestos razonables.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X