Tras las últimas aclaraciones de Bill en el comentario de la respuesta de Critch, creo que la pregunta vuelve a ser interesante. Mi opinión:
Una cosa que siempre me pareció que se me escapaba cuando aprendí sobre la teoría de la probabilidad es que ésta está intrínsecamente ligada a la información, y las probabilidades sólo se definen en el contexto de la información. Las probabilidades no son absolutas; dos personas que tienen información diferente sobre un acontecimiento pueden discrepar sobre su probabilidad, aunque ambas sean perfectamente racionales. Del mismo modo, si obtienes nueva información relevante para un determinado acontecimiento, probablemente debas reevaluar lo que crees que es la probabilidad de que ocurra. Tu problema particular es interesante porque la nueva información que obtienes no es suficiente para que revises esa probabilidad por consideraciones puramente matemáticas, pero llegaré a eso en su momento.
Teniendo en cuenta el párrafo anterior, comparemos dos juegos:
G1. Se te dan dos puertas cerradas, A y B, con dos números detrás, y tu objetivo es elegir la puerta con el número más alto. No se le da ninguna información sobre las puertas o los números.
G2. Te dan dos puertas cerradas, A y B, con dos números detrás, y tu objetivo es elegir la puerta con el número más alto. Se le permite mirar detrás de una de las puertas y entonces haz tu elección.
Para el primer juego, por simetría, está claro que no puedes hacerlo mejor que elegir una puerta al azar, lo que te da una probabilidad de éxito de exactamente 1/2. Sin embargo, el segundo juego tiene la posibilidad de ser mejor. Estás jugando por el mismo objetivo con estrictamente más información, así que podrías esperar ser capaz de hacerlo algo mejor. [Originalmente había dicho que era obviamente mejor, pero ahora no estoy tan seguro de que sea obvio]. Lo difícil es cuantificar cuánto mejor, ya que no está claro cómo razonar sobre la relación entre dos números si se conoce uno de ellos y no se tiene información sobre el otro. De hecho, ni siquiera es posible cuantificarlo matemáticamente.
"¿Pero cómo puede ser eso?", se preguntará. "Se trata de un problema matemático, así que ¿cómo es posible que la solución no sea matemáticamente definible?". Ahí está el problema: parte de la cuestión es que el problema no es formulado de forma matemáticamente rigurosa. Eso se puede arreglar de múltiples maneras, y cualquier manera que elijamos hará que la paradoja se evapore. El problema es que se nos pide que razonemos sobre "la probabilidad de responder correctamente a la pregunta", pero no está claro en qué contexto debe calcularse esa probabilidad. (Recuerde: las probabilidades no son absolutas). En los problemas y rompecabezas comunes de la teoría de la probabilidad, esto no es un problema porque suele haber un "contexto aplicable más general" sin ambigüedades: obviamente, debemos suponer exactamente lo que se da en el problema y nada más. Aquí no podemos hacer eso porque el contexto más general, en el que no asumimos nada sobre cómo los números $x$ y $y$ son elegidos, no define en absoluto un espacio de probabilidad y, por tanto, la "probabilidad de responder correctamente a la pregunta" no es un concepto significativo.
He aquí una pregunta de probabilidad ostensible más sencilla que muestra la misma falacia: "¿cuál es la probabilidad de que un número entero positivo sea mayor que 1.000.000?" Para responderla, tenemos que elegir una distribución de probabilidad sobre los enteros positivos; la pregunta no tiene sentido si no se especifica eso.
Como he dicho, hay múltiples maneras de arreglar esto. Aquí hay un par:
I1. (Interpretación de Tyler.) Realmente queremos la probabilidad de responder correctamente a la pregunta dado un determinado $x$ y $y$ sea mayor que 1/2. (La probabilidad exacta dependerá, por supuesto, de los dos números).
I2. (Interpretación de Critch.) De forma más general, queremos que la probabilidad de responder correctamente dada una determinada distribución de probabilidad para $(x,y)$ sea mayor que 1/2. (La probabilidad exacta dependerá, por supuesto, de la distribución).
(En realidad, ambas son equivalentes desde el punto de vista matemático). Está claro que si supiéramos cuál es esa distribución, podríamos elaborar estrategias para conseguir una probabilidad de éxito estrictamente superior a 1/2. Eso es bastante obvio. No es tan obvio que un solo estrategia (como la del enunciado de la pregunta) puede funcionar para todo distribuciones de $(x,y)$ pero es cierto, como demuestra la prueba de Bill. Es un hecho interesante, pero difícilmente paradójico ahora.
Permítanme resumir dando interpretaciones matemáticas adecuadas de la afirmación informal "existe una estrategia que responde correctamente a la pregunta con una probabilidad estrictamente superior a 1/2", con los cuantificadores en su lugar:
(1a) $\exists \text{ strategy } S: \forall x, y: \exists \delta > 0$ : $S$ responde correctamente en $x$ , $y$ con una probabilidad de al menos $1/2 + \delta$ .
(1b) $\exists \text{ strategy } S: \forall \text{ probability distributions } P \text{ on } \mathbb{N}^2: \exists \delta > 0$ : $S$ responde correctamente, cuando $x$ , $y$ se eligen en función de $P$ con una probabilidad de al menos $1/2 + \delta$ .
Creo que con los cuantificadores adecuados y la dependencia de $x$ y $y$ explícita, se convierte en un resultado matemático genial en lugar de una paradoja. En realidad, basándome en mis argumentos del principio, ni siquiera es tan sorprendente: nosotros debe esperan hacerlo mejor que las adivinanzas al azar, ya que se nos da información. Sin embargo, el simple hecho de conocer un número no parece muy útil para determinar si el otro número es mayor, y eso se refleja en el hecho de que no podemos mejorar nuestra probabilidad en ninguna cantidad positiva fija sin más contexto.
Editar: Se me ocurre que la última parte de mi discusión anterior tiene un sabor no estándar-analítico. De hecho, utilizando la primera versión de la fórmula para simplificar (las dos son equivalentes), y el principio de idealización, creo que obtenemos inmediatamente:
(2) $\exists \text{ strategy } S: \exists \delta > 0: \forall \text{ standard }x, y:$ $S$ responde correctamente en $x$ , $y$ con una probabilidad de al menos $1/2 + \delta$ .
(Por favor, corríjanme si me equivoco). El número $\delta$ no es necesariamente estándar, y un argumento básico muestra que en realidad debe ser más pequeño que todos los reales positivos estándar, es decir, infinitesimal. Por lo tanto, podemos decir que ser capaz de mirar detrás de una puerta nos da una ventaja infinitesimal e incuantificable sobre las adivinanzas al azar. En realidad, esto encaja bastante bien con mi intuición. (Podría seguir siendo una observación no trivial que la estrategia $S$ puede tomarse como estándar; no estoy seguro de ello...)