9 votos

Una aproximación estadística a los prisioneros problema

Hace dos días, he encontrado este problema en reddit (no tengo acceso a reddit cuando hice las matemáticas, así que lo hice con 24 en lugar de 23, y decidí que el alcaide escogido a alguien todos los días, no "cada vez que él se siente como que"):

Un funcionario de prisiones le dice a 24 presos que él tiene un "juego" para ellos. Una vez por día, el director elige a un preso al azar y se les lleva a Cambiar de Habitación. El acertadamente llamado Interruptor de la Habitación tiene dos interruptores, tanto en la posición de Apagado en primer lugar, que están conectados a nada. El llamado preso tiene que alternar exactamente un interruptor.

En cualquier momento, a cualquier preso que se puede ir al guardián y le digo que de los 24 presos fuimos todos a la Sala de switches al menos una vez. Si eso es cierto, todos están liberados. Si no, van a ser las salchichas para los otros presos o algo.

Los presos pueden venir con un plan de ahora , pero no siempre va a ser capaz de comunicarse de nuevo hasta que alguien le dice el guardián.


EDITAR Después de algunos debates con @alex.jordania, quería aclarar que mi intención. Mi perspectiva es que esto es una metáfora para "¿cómo le digo que N distintos eventos, de manera uniforme y aleatoria sucediendo, todo ha sucedido al menos una vez si usted sólo tiene 2 bits para repuesto", y no tiene nada que ver con un verdadero guardián (que podría ser parcial en sus elecciones al azar o utilizar otro modelo de distribución para el tornillo de seguridad de los prisioneros), o real de los presos.

Soy el único interesado en una respuesta que supone un prisionero está seleccionada de forma aleatoria y uniforme de una vez cada día (no "de vez en cuando", como se indica en el reddit de riddle), así que usted puede ignorar cualquier supuesto de que el guardián que hay para moler los presos a las salchichas o selecciona personas con un sesgo o simplemente no seleccionar a nadie.


El "clásico" de la solución es que los presos designar a un líder. Cuando un preso entra en el Interruptor de la Habitación (excepto el líder), si nunca has estado allí y encontrar el primer interruptor en la posición de Apagado, se enciende. De lo contrario, alternar el otro interruptor. Cuando el líder entra en el Interruptor de la Habitación, si ve que el primer interruptor en la posición On, él sabe que alguien que nunca ha estado allí antes ha sido, por lo que los cargos primero y apaga el interruptor. Cuando él ha contado a 23, él sabe que todo el mundo ha estado allí por lo menos uno.

La cosa es que esta solución es una mierda. Suponiendo 24 presos de nuevo, y saber que están elegidos al azar, se puede representar la totalidad de la cosa como una serie de distribuciones geométricas (esto también supone que estoy haciendo lo correcto, que no puede ser):

$$ X: \text{número de días antes de que el Líder va al Interruptor de la Sala de}\\ X \sim Geom\left(\frac{1}{24}\right)\\ E(X) = 24, Var(X) = 552\\ $$ $$ Y_n: \text{número de días antes de que uno de los n restantes prisionero}\\ \text{se encuentra el Interruptor de la Habitación por primera vez (n de 1 a 23)}\\ Y_n \sim Geom\left(\frac{n}{24}\right)\\ E(Y_n) = \frac{24}{n}, Var(Y_n) = \frac{24 (24-n)}{n^2} $$

Dado que los valores esperados y la varianza puede ser linealmente agregado, podemos esperar que el Líder dirá el guardián después de que, en promedio, 642 días, con una desviación estándar de 116, asumiendo el líder va a ir $E(X)$ días después de cualquier preso fue por primera vez como modelado por $E(Y_n)$:

$$ Z: \text{Número de días antes de que el Líder anuncia todos han sido para el Interruptor de la Sala de}\\ E(Z) = \sum_{n=1}^{23}E(X) + E(Y_n) = 552 + \sum_{n=1}^{23}E(Y_n) \aprox 552 + 89.6229 \aprox 641.6229\\ Var(Z) = \sum_{n=1}^{23}Var(X) + Var(Y_n) = 12696 + \sum_{n=1}^{23}Var(Y_n) \aprox 12696 + 833.3521 \aprox 13529.3521\\ \sigma = \sqrt{13529.3521} = 116.3157 $$

Muy simple, las matemáticas nos dicen que después de 642 días de cada prisionero, ha sido en promedio de 26 veces el Interruptor de la Habitación. Esto se ve como una horrible pérdida de tiempo.

Estoy bastante seguro de que es posible calcular cuántos días tendría que esperar antes de tener un 99% de posibilidades (o más) de que cada preso ha estado allí. El problema es, yo soy sólo la mitad del camino a través de mi colegio estadísticas de la clase, y sólo hemos visto fácil distribuciones donde los éxitos son independientes, así que no estoy demasiado seguro de cómo hacer frente a esa.

¿Cómo calcular las probabilidades de que cada preso ha sido para el Interruptor de la Habitación después de la $Z$ días?


EDIT acabo de hacer un rápido y sucio programa para que se ejecute "simulaciones", y se necesita un promedio de 90.6 días hasta que todos los prisioneros ha visitado el Interruptor de la Habitación, con una desviación estándar de 28.5. Hacer que en una distribución normal, debe ser alrededor de 157 días antes de que podamos afirmar con un 99% de certeza de que cada preso ha visitado el Interruptor de la Habitación al menos una vez, y 179 días para el 99,9% de certeza. Huelga decir que usted está bastante seguro después de 641 días...

Es un método empírico y no se siente matemáticamente satisfacciones, así que la pregunta sigue abierta para las mejores respuestas.

7voto

Shabaz Puntos 403

Es incluso peor que eso. En el día $1$ algunos prisionero gira el interruptor de encendido (a menos que el líder va primero). A continuación, todos los presos que visitar la próxima no se puede encender, por lo que esas visitas son un desperdicio.

La página aquí tiene una buena valoración crítica. Su solución es la Solución 6: recuento Simple y afirma con 100 presos que necesita de 28 años. Hay algunas estrategias, y me encontré con un muy buen papel en el que no puedo encontrar de nuevo.

Para su pregunta, podemos pretender que cada prisionero es independiente de los otros (que es una mejor aproximación de lo que parece). Después de $d$ días en los que el preso ha $(\frac {23}{24})^d$ de probabilidad de no haber visitado la habitación. Tener un $99\%$ de probabilidad de que todos ellos han visitado, necesitamos $$(1-(\frac {23}{24})^d)^{24}=0.99 \\1-(\frac {23}{24})^d=0.99^{\frac 1{24}}\\(\frac {23}{24})^d=1-0.99^{\frac 1{24}}\\d=\frac {\log (1-0.99^{\frac 1{24}})}{\log \frac {23}{24}}\approx 182.76$$ tienes razón en que esto es mucho más rápido

5voto

Philip Fourie Puntos 12889

Para quitar la independencia suposición de que Ross utiliza para la simplificación te deja con un desordenado ecuación, pero que podría ser resuelto con precisión arbitraria, si se le permite a un ordenador.

Después de $d$ días $24^d$ posibles secuencias pueden haber llegado a pasar. ¿Cuántos de estos tienen cada prisionero representados? Así, podríamos restar los sin prisionero #1, a continuación, aquellos sin #2 y así sucesivamente. Pero hemos overcounted lo que resta de esta manera. Que me tire de nuevo en aquellos con #1 y #2 que faltan. Si estás familiarizado con la inclusión-exclusión en el principio, entonces lo que esto lleva a que se

$$P(d) =\frac{24^d-\binom{24}{23}23^d+\binom{24}{22}22^d-\cdots\pm\cdots-\binom{24}{1}1^d}{24^d}$$

donde $P(d)$ es la probabilidad de que todos los prisioneros han visitado la habitación por día $d$. Una ecuación como $P(d)=0.99$ no es la cosa más agradable para tratar de resolver, pero usted puede obtener ayuda del ordenador. Puede ser útil para reconocer que usted está buscando solamente entero $d$.

@Ross, el resultado sugiere $d$ debe estar cerca de la $182.76\ldots$, para el 99% de certeza. Bien, $P(182)=0.989655\ldots$$P(183)=0.990085\ldots$, por lo que es difícil argumentar que vale la pena el esfuerzo para ser más preciso que el de hacer una suposición de independencia.

2voto

Philip Fourie Puntos 12889

Un problema con lo que usted está tratando de hacer es que usted no está teniendo en cuenta el sadismo de los de la guardia. Tanto su simulación y @Ross en la estimación de suponer que los prisioneros son enviados en un uniforme de forma aleatoria para el interruptor de la habitación. Es discutible si es o no de "el guardián elige un preso al azar" significa realmente que. Y he escuchado versiones de este problema que dejan fuera la frase 'al azar'. El guardián podría frustrar estas estrategias por la elección de algunos presos 1/100 de la probabilidad de los demás. El guardián podría ser muy sádico y deliberadamente nunca elegir un prisionero en particular. O el guardián podría estar usando su cerebro humano "al azar" elige un prisionero, que se producirá a ser un verdadero uniforme de la selección al azar.

La clásica solución que implica un líder contar es determinista, ya que si el líder de la cuenta a los 24 (23?), es más seguro. Si usted fuera uno de estos prisioneros, ¿de verdad apuesta que el guardián es un verdadero uniforme de la selección al azar?


EDIT: OP pregunta "¿Cómo podrías calcular la probabilidad de que cada preso ha sido para el Interruptor de la Habitación después de la Z días?"

Mi respuesta es, en esencia, que usted no puede hacer esto, hasta que explícitamente asume una distribución particular para que los presos son seleccionados al azar. Y por qué en la tierra haría que si este o cualquier situación similar fue real?

No entiendo el abajo votos, a menos que alguien

  • piensa que "el azar" (que significa "no se puede predecir') significa lo mismo que 'uniformemente al azar"
  • y pensar que yo estoy siendo descarado y como que yo podría dejar el guardián de manipulaciones con los interruptores. Pero permitiendo que el guardián de la utilización de otros aleatoria de los procesos de selección no hacer de ellos un mentiroso, como la manipulación con los interruptores de haría.

Parte de la belleza de mi manera de entender este problema y el 'líder' solución es encontrar una estrategia que contraría el guardián de las imperfecciones humanas, no importa cómo el proceso de selección va. Tenemos que asumir que el guardián es honesto o de lo contrario no tiene sentido nada de eso.

1voto

Jonas Pegerfalk Puntos 2298

Como varias personas ya han sugerido (pero nadie respondió), esto es esencialmente el mismo que el cupón colector del problema: en un conjunto de $n$ único cupones que se dibujan con reemplazo, cuantas veces se tarda hasta que usted ha dibujado cada cupón al menos una vez?

Este tipo de modelo es adecuado para la combinación de múltiples distribuciones geométricas con igualdad de probabilidades (como es el caso aquí). Por los dos enlaces de arriba, dejando $T_n$ el número de ensayos para recoger todas las $n$ cupones (o para enviar todos los $n$ a los presos de que el Interruptor de la Habitación), entonces

$$ E(T_n) = n \cdot H_n\\ Var(T_n) = \frac{\pi^2 n^2}{6} - n\cdot H_n $$

Por lo tanto, la reutilización de la mi $Z$ variable:

$$ Z: \text{Días antes de que el Líder anuncia a todos los presos sido para el Interruptor de la Sala de}\\ E(Z) = E(T_{24}) = 24 \cdot H_{24} \approx 90.623\\ Var(Z) = Var(T_{24}) = 96\pi^2 - 24H_{24} \approx 856.859\\ \sigma = \sqrt{Var(Z)} \approx 29.2722 $$

Ambos valores coinciden lo que tengo con mi simulaciones.

Parece que sería bastante difícil evaluar una probabilidad entre 0 y 1 para si o no a todos los presos que se han visitado la habitación después de las $z$ días siguientes exactamente la curva de distribución, viendo cómo queda sesgada. La aproximación como una distribución normal $N(856.859, 29.2722^2)$, hay un 99% de posibilidades de que todos los prisioneros se han visitado el Interruptor de la Habitación después de la 158.72 días; el 99,9% de posibilidades de que después de 181.081 días; el 99,99% después de 199.487 días; y después de 233.822 días, mi venerado calculadora no puede manejar un número lo suficientemente pequeño como para distinguir la probabilidad de 1.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X