Consideremos un ejemplo más sencillo: tienes una moneda justa. Tiras la moneda una y otra vez. ¿Cuál es el número esperado de veces que lanzará la moneda antes de obtener una cara? Por supuesto, es posible que lanzará la moneda infinitas veces y nunca obtendrá cara. Por otro lado, también es posible que salga cara en el primer lanzamiento. Afortunadamente, tu intuición es que es muy poco probable que tengas que lanzar la moneda más de un par de veces antes de que salga cara. Podemos resumir todo el proceso con un diagrama de árbol:
La probabilidad en cada hoja es el producto de todas las probabilidades que conducen a ella (esto es un resultado de la independencia; tenga en cuenta que este tipo de diagramas a menudo puede ser útil para entender el condicionamiento). En la fila superior, seguimos lanzando colas una y otra vez. Los resultados finales terminan todos en cara. Entonces \begin {align} \mathbb {E}[ \text {número de lanzamientos}] &= 1 \cdot \mathrm {P}( \mathrm {H}) + 2 \cdot \mathrm {P}( \mathrm {TH}) + 3 \cdot \mathrm {P}( \mathrm {TTH}) + 4 \cdot \mathrm {P}( \mathrm {TTTH}) + \dotsb \\ &= \frac {1}{2} + \frac {2}{4} + \frac {3}{8} + \frac {4}{16} + \dotsb \\ &= \sum_ {n=1}^{ \infty } \frac {n}{2^n} \\ &= 2. \end {align} Por lo tanto, en promedio, podemos esperar lanzar la moneda dos veces.
Obsérvese que podemos simplificar enormemente esta imagen observando que si primero lanzamos cruz, entonces volvemos al principio. Eso nos da esta imagen:
Entonces \begin {align} \mathbb {E}[ \text {número de lanzamientos}] &= 1 \cdot \mathrm {P}( \mathrm {H}) + (1+ \mathbb {E}[ \text {número de lanzamientos}]) \cdot \mathrm {P}( \mathrm {T}) \\ &= \frac {1}{2} + \frac {1+ \mathbb {E}[ \text {número de lanzamientos}]}{2} \end {align} El $1+\mathbb{E}[\text{number of tosses}]$ viene del hecho de que si sacamos cruz en el primer lanzamiento de la moneda, entonces ya hemos lanzado la moneda una vez, pero todo lo demás es como si acabáramos de empezar el proceso desde el principio. Esto se puede expresar en términos de probabilidad condicional, pero no creo que la notación adicional ayude mucho en este caso. En cualquier caso, resolviendo el número esperado de lanzamientos, obtenemos $$ \frac{1}{2} \mathbb{E}[\text{number of tosses}] = 1 \implies \mathbb{E}[\text{number of tosses}] = 2. $$
Entonces, ¿qué tiene que ver esto con el problema de las cuevas? Para generalizar el argumento anterior al problema de la cueva, imagina primero que estás en la habitación descrita, y que tienes una moneda de tres caras justa (¿sería mejor si sugiriera que tienes un d3?). Cada vez que vuelves al principio, lanzas tu moneda de tres caras para decidir por qué puerta pasar. Con la probabilidad $\frac{1}{3}$ se pasa por la puerta de las 3 horas y se vuelve al inicio, con probabilidad $\frac{1}{3}$ atraviesas la puerta de las 5 horas y escapas, y con probabilidad $\frac{1}{3}$ pasas por la puerta de las 7 horas y vuelves al principio.
Así que, supongamos que primero se elige la puerta de las tres horas. ¿Cuánto tiempo espera tener que caminar en total? Vas a tener que caminar durante 3 horas, pero luego vuelves al principio. El tiempo que esperas caminar desde allí es el tiempo esperado, que es lo que estamos tratando de calcular. Por lo tanto, si primero pasa por la puerta de las tres horas, entonces vas a caminar $$ 3\text{ hours} + \mathbb{E}[\text{total time}].$$ En otras palabras, utilizando el lenguaje de la probabilidad condicional (aquí, va a hacer las cosas un poco más claras, creo), tenemos $$ \mathbb{E}[\text{total time} \mid \text{chose 3 hour door}] = 3 + \mathbb{E}[\text{total time}]. $$
Por un razonamiento similar, tenemos \begin {align} \mathbb {E}[ \text {tiempo total} \mid \text {elegir la puerta de 5 horas}] &= 5 && ( \text {no volvemos al principio}) \\ \mathbb {E}[ \text {tiempo total} \mid \text {elegir la puerta de 7 horas}] &= 7 + \mathbb {E}[ \text {tiempo total}] \end {align} Como cada uno de estos eventos es igualmente probable, sumamos para obtener \begin {align} \mathbb {E}[ \text {tiempo total}] &= \mathrm {P}( \text {puerta de 3 horas}) \cdot (3 + \mathbb {E}[ \text {tiempo total}]) + \mathrm {P}( \text {puerta de 5 horas}) \cdot 5 \\ & \qquad\qquad + \mathrm {P}( \text {puerta de 7 horas}) \cdot (7 + \mathbb {E}[ \text {tiempo total}]) \\\\ &= \frac {3 + \mathbb {E}[ \text {tiempo total}]}{3} + \frac {5}{3} + \frac {7 + \mathbb {E}[ \text {tiempo total}]}{3}. \end {align} Sólo queda resolver el tiempo total de recorrido esperado. Para simplificar la notación, dejemos que $E := \mathbb{E}[\text{total time}]$ . La ecuación anterior se reduce a \begin {align} E = \frac {3 + E}{3} + \frac {5}{3} + \frac {7 + E}{3} = \frac {15 + 2E}{3} & \implies \frac {E}{3} = 5 \\ & \implies E = 15. \end {align} En otras palabras, deberíamos esperar viajar 15 horas en total (que es lo que dan las otras respuestas).
La moraleja de esta historia es que viajar durante un tiempo infinito es, en principio, posible. Sin embargo, es muy poco probable que se pueda viajar para siempre (de hecho, se viajará durante una cantidad infinita de tiempo con una probabilidad nula; a efectos prácticos, nunca ocurrirá).