45 votos

Escogiendo dos números reales al azar entre 0 y 1, ¿por qué la probabilidad de que el primero sea mayor que el segundo no es exactamente del 50%?

Intenté responder esta pregunta en Quora, y me han dicho que estoy pensando en el problema de forma incorrecta. La pregunta era:

Se escriben dos números reales distintos entre 0 y 1 en dos hojas de papel. Tienes que seleccionar una de las hojas al azar y declarar si el número que ves es el mayor o el menor de los dos. ¿Cómo ¿Cómo se puede esperar acertar más de la mitad de las veces que se juega a este juego?

Mi respuesta fue que era imposible, ya que la probabilidad debería ser siempre del 50% por la siguiente razón

¡No se puede! He aquí la razón:

El conjunto de números reales entre (0, 1) se conoce como conjunto incontablemente infinito ( https://en.wikipedia.org/wiki/Uncountable_set ). Un conjunto que es incontable tiene la siguiente propiedad interesante:

Dejemos que $\mathbb{S}$ sea un conjunto incontablemente infinito. Dejemos, $a, b, c, d \in \mathbb{S} (a \neq b, c \neq d)$ . Si $x$ es un subconjunto incontablemente infinito de $\mathbb{S}$ que contiene todos los elementos de $\mathbb{S}$ en el intervalo $(a, b)$ y $y$ es otro subconjunto incontablemente infinito de $\mathbb{S}$ que contiene todos los elementos de $\mathbb{S}$ en el intervalo $(c, d),$ $x$ y $y$ tienen la misma ¡cardinalidad (tamaño)!

Así, por ejemplo, el conjunto de todos los números reales entre (0, 1) es en realidad el exactamente el mismo tamaño ¡como el conjunto de todos los números reales entre (0, 2)! También tiene el mismo tamaño que el conjunto de todos los números reales entre (0, 0.00001). De hecho, si se tiene un conjunto incontablemente infinito en el intervalo $(a, b)$ y $a<n<b$ entonces exactamente el 50% de los números del conjunto son mayores que $n$ y el 50% son menos de $n$ , no importa lo que elijas para $n$ . Esto es importante porque nos dice algo poco intuitivo sobre nuestra probabilidad en este caso. Digamos que que el primer número que elegiste es 0,03. Podrías pensar "Bueno, el 97% de los otros números posibles son mayores que éste, así que el otro número es probablemente mayor". Se equivocaría. En realidad hay exactamente tantos números entre (0, 0,03) como entre (0,03, 1). Incluso 0,03, la mitad de los otros números posibles son más pequeños que él, y la mitad de los otros números posibles son mayores que él. Esto significa que todavía hay un 50% de probabilidad de que el otro número sea mayor, y un 50% de probabilidad de que sea menor.

" ¿Pero cómo puede ser eso? " preguntas, " ¿por qué no es $\frac{a-b}{2}$ el punto medio? "

La verdadera pregunta es, ¿por qué creemos que $\frac{a-b}{2}$ ¿es el punto medio para empezar? La razón es probablemente la siguiente: parece que tiene más sentido para la discreta (finito/contablemente infinito). Por ejemplo, si en lugar de los números reales tomáramos el conjunto de todos los múltiplos de $0.001$ en el intervalo $[0, 1]$ . Ahora tiene sentido decir que 0,5 es el punto medio, ya que sabemos que el número de números por debajo de 0,5 es igual al número de números por encima de 0,5. Si intentáramos decir que el punto medio es 0,4 encontraríamos que ahora hay más números por encima de 0,4 que por por debajo de 0,4. Esto ya no se aplica cuando se habla del conjunto de todos los números reales $\mathbb{R}$ . Por extraño que parezca, ya no podemos hablar de tener un punto medio en $\mathbb{R}$ porque cada número de $\mathbb{R}$ podría considerarse un punto medio. Para cualquier punto de $\mathbb{R}$ los números por encima y los números por debajo siempre tienen la misma cardinalidad.

Véase el artículo de Wikipedia sobre Cardinalidad del continuo ( https://en.wikipedia.org/wiki/Cardinality_of_the_continuum ).

Mi pregunta es, desde el punto de vista matemático, ¿es esto correcto? La persona que me dijo que esto es incorrecto es bastante conocida, y no es alguien que yo asumiría que se equivoca a menudo, especialmente para este tipo de problemas.

El razonamiento dado para que mi respuesta fuera incorrecta fue el siguiente:

Su conclusión no es correcta.
Tienes razón en que el conjunto de números reales números reales entre 0 y 1 es incontablemente infinito, y la mayor parte de lo que dijo aquí es correcto. Pero la última parte es incorrecta. Si eliges un número real al azar entre 0 y 1, el número tiene un 97% de posibilidades de estar por encima de 0,03. Veamos esto de otra manera. Sea K = {todos los enteros divisibles por 125423423}. Sea M = {todos los enteros no divisibles por 125423423}. K y M tienen el mismo tamaño, ¿verdad? ¿Significa esto que, si eliges un entero al azar, tiene un 50% de posibilidades de estar en K y un 50% de posibilidades o no? Un entero aleatorio tiene un 50% de posibilidades de ser divisible por 125423423?

La razón por la que no estoy de acuerdo con esta respuesta es porque la última frase debería ser realmente cierta. Si el conjunto de todos los números que son divisibles por 125423423 tiene el mismo tamaño que el conjunto de números que no lo son, debería haber una probabilidad del 50% de elegir un número al azar del primer conjunto, y una probabilidad del 50% de elegir un número del segundo. Este es el caso de los conjuntos finitos. Si hay dos conjuntos finitos disjuntos con igual cardinalidad, y se elige un número al azar de la unión de los dos conjuntos, debería haber un 50% de probabilidades de que el número provenga del primer conjunto, y un 50% de probabilidades de que el número provenga del segundo conjunto. ¿Se puede generalizar esta idea para conjuntos infinitos de igual cardinalidad?

¿Es mi respuesta incorrecta? Si es así, ¿me he perdido algo sobre cómo se relacionan las cardinalidades de dos conjuntos con la probabilidad de elegir un número de uno de ellos? ¿Dónde me he equivocado en mi lógica?

0 votos

Te falta un jacobiano en la transformación de variables (continuas). Densidad de $U(0,1)$ es el doble que el de $U(0,2)$ - por lo que mientras cada $x$ tiene una probabilidad nula en ambos casos, estos ceros son de distinto orden: uno es el doble que el otro.

4 votos

math.stackexchange.com/questions/655972/ describe una estrategia que ganará estrictamente más de la mitad de las veces.

6 votos

Su razonamiento sobre la probabilidad utilizando la cardinalidad conduce a una paradoja. Si seleccionas un número uniformemente entre (0,1], entonces es tan probable que selecciones un número entre (1/2, 1] como (1/4, 1/2] como (1/8,1/4] como (1/16, 1/8], ..., y así sucesivamente. Entonces, ¿cuál es la probabilidad de cada uno de estos eventos?

65voto

Milo Brandt Puntos 23147

Sí, su respuesta es fundamentalmente errónea. Permítame señalar que ni siquiera es correcta en el caso finito. En particular, usted está utilizando el siguiente axioma falso:

Si dos conjuntos de resultados son igualmente grandes, son igualmente probables.

Sin embargo, esto es erróneo incluso si sólo tenemos dos eventos. Para un ejemplo de la vida real, consideremos una variable aleatoria $X$ que es $1$ si me casaré exactamente dentro de un año y que es $0$ de lo contrario. Ahora bien, es evidente que los conjuntos $\{1\}$ y $\{0\}$ son igualmente grandes, cada uno con un elemento. Sin embargo, $0$ es mucho más probable que $1$ aunque ambos son resultados posibles.

El punto aquí es probabilidad no se define a partir de cardinalidad . Se trata, de hecho, de una definición independiente. La definición matemática de probabilidad es algo así:

Para hablar de la probabilidad, partimos de un conjunto de resultados posibles. A continuación, damos una función $\mu$ que toma un subconjunto de resultados y nos dice qué probabilidad tienen.

Uno pone varias condiciones a $\mu$ para asegurarnos de que tiene sentido, pero en ninguna parte lo relacionamos con la cardinalidad. Como ejemplo, en el ejemplo anterior con resultados $0$ y $1$ que no son igualmente probables, uno podría tener $\mu$ definió algo así: $$\mu(\{\})=0$$ $$\mu(\{0\})=\frac{9999}{10000}$$ $$\mu(\{1\})=\frac{1}{10000}$$ $$\mu(\{0,1\})=1$$ que no tiene nada que ver con la parte del conjunto de resultados, que estaría representada por la función $\mu'(S)=\frac{|S|}2$ .

En general, su discusión sobre la cardinalidad es correcta, pero es irrelevante. Además, las conclusiones que sacas son incoherentes. Los conjuntos $(0,1)$ y $(0,\frac{1}2]$ y $(\frac{1}2,1)$ son igualmente grandes por parejas, por lo que tu razonamiento dice que son igualmente probables. Sin embargo, el número fue definido para estar en $(0,1)$ así que estamos diciendo que todas las probabilidades son $1$ - por lo que estamos diciendo que estamos seguros de que el resultado estará en dos intervalos disjuntos. Este nunca sucede, sin embargo su método predice que siempre sucede.

En otro orden de cosas, pero relacionado con el panorama general, hablas de que los "conjuntos incontables" tienen la propiedad de que cualquier intervalo no trivial es también incontable. Esto es cierto para $\mathbb R$ pero no todos los subconjuntos incontables, como $(-\infty,-1]\cup \{0\} \cup [1,\infty)$ tiene que el intervalo $(-1,1)=\{0\}$ que no es incontablemente infinito. Peor aún, no todos los conjuntos incontables tienen una noción intrínseca de ordenación -¿cómo, por ejemplo, se ordena el conjunto de subconjuntos de los números naturales? El problema no es que no haya una respuesta, sino que hay muchas respuestas contradictorias al respecto.

Creo que, tal vez, lo más importante que hay que pensar aquí es que los conjuntos realmente no tienen mucha estructura. Los matemáticos añaden más estructura a los conjuntos, como las medidas de probabilidad $\mu$ u órdenes, y éstas cambian fundamentalmente su naturaleza. Aunque los conjuntos desnudos tienen resultados contradictorios con los conjuntos que contienen copias igualmente grandes de sí mismos, éstos no se traducen necesariamente cuando se añade más estructura.

6 votos

Esta es una excelente explicación.

1 votos

Tangente: por eso la Mecánica Estadística me dejó perplejo en la universidad. (Para explicarlo mejor: empieza exactamente con este postulado, que cada microestado tiene la misma probabilidad (dadas algunas condiciones)).

0 votos

@Milo Brandt: ¿qué libro contiene este tipo de problemas? ¿Puedes recomendar algo? ¡La verdad es que no lo sé!

42voto

vadim123 Puntos 54128

La respuesta de la OP es incorrecta. Los números no se eligen en función de cardinalidad pero basado en medir . No es posible definir un distribución de probabilidades utilizando la cardinalidad (en un conjunto infinito). Sin embargo, es posible utilizar la medida.

Aunque el problema no lo especifica, si suponemos que el distribución uniforme en $[0,1]$ , entonces si $x=0.03$ entonces $y$ será mayor que $x$ El 97% de las veces. Por supuesto, si se utiliza una distribución de probabilidad diferente para seleccionar $x,y$ Entonces surgirá una respuesta diferente. Resulta que es posible ganar más de la mitad de las veces incluso SIN SABER la distribución utilizada, véase este sorprendente resultado aquí .

3voto

Oto Brglez Puntos 195

Se escriben dos números reales distintos entre 0 y 1 en dos hojas de papel.

Al principio, no se sabe nada sobre el proceso de elección y escritura, salvo el rango de valores posibles.

Tienes que seleccionar una de las hojas al azar y declarar si el número que ves es el mayor o el menor de los dos.

Pero se puede ver el número antes de hacer una declaración.

¿Cómo se puede esperar acertar más de la mitad de las veces que se juega este juego?

Se puede observar la forma en que se juega y tratar de modelar el algoritmo utilizado para elegir los números y utilizar ese modelo al tomar una decisión.

  1. Si el algoritmo parece ser una distribución uniforme aleatoria no correlacionada y el número visto es inferior a 0,5, entonces declare que es el menor de los dos. Esto es fácil de superar.
  2. Si el algoritmo parece escoger algún número al azar, retorcerlo hasta el lugar N donde N >> 1 y luego escribir el segundo número que difiere en 1 en el último lugar, entonces es en gran medida irrelevante lo que se declare. Esto es imposible de superar.
  3. Si el algoritmo consiste en confundirte activamente sobre lo que es el algoritmo, las cosas podrían ponerse realmente interesantes.

La pregunta original no se refiere tanto a las matemáticas como a la teoría del juego. En este juego, cualquier bando puede elegir jugar hasta el empate y tener éxito en ello. De lo contrario, se trata de un concurso de habilidad (aunque parece que no hay ninguna estrategia ganadora para el bando nº 1 que no sea convencer al bando nº 2 de una estructura de pagos distinta a la de 2 a 1).

2voto

marty cohen Puntos 33863

Esto es lo que pienso:

Supongamos que el primer número aleatorio es $x$ , $0 \le x \le 1$ .

Si $y$ es el segundo número aleatorio, la probabilidad de que $y \le x$ es $x$ .

La sobreprobabilidad es $\int_0^1 x\,dx =\frac{x^2}{2}\big|_0^1 =\frac12 $ .

2 votos

Así que asumimos una distribución uniforme. (No se indica en el problema.) Sin embargo, este cálculo sigue sin ser lo que aparece en el problema. Este cálculo es la probabilidad de que $X \ge Y$ . Pero lo que realmente queremos es el probabilidad condicional que $X \ge Y$ dado $Y$ . ¿No dependerá esa respuesta de $Y$ ? Y así poder hacer una conjetura que sea correcta mejor que $1/2$ ¿el tiempo?

1voto

Daniel R. Collins Puntos 1497

Esta es mi interpretación de la pregunta formulada: (1) Ignora la pregunta del título y atiende sólo a la pregunta del texto, que actualmente es diferente. (2) Supongamos que se eligen dos números al azar de una distribución uniforme en $(0, 1)$ . (3) Supongamos que el jugador puede ver el primer número antes de adivinar la relación con el segundo.

Concedido eso, entonces el primer error de razonamiento del OP es este. Básicamente ha mezclado el razonamiento entre situaciones discretas (finitas) y continuas (infinitas):

De hecho, si se tiene un conjunto incontablemente infinito en el intervalo $(a,b)$ y $a<n<b$ entonces exactamente el 50% de los números del conjunto son mayores que $n$ y el 50% son menos de $n$ No importa lo que elijas para elija para $n$ .

Este razonamiento sería cierto para los conjuntos finitos. Mira la definición estándar de "proporción" (por ejemplo $50\%$ ): $p = x/N$ , donde $x$ es el número de elementos con alguna característica, y $N$ es el tamaño total del conjunto. Entonces, si $n$ los elementos tienen la característica, y $n$ tampoco tienen la característica, entonces $p = n/(2n) = 1/2 = 50\%$ .

Pero este cálculo es indefinido para conjuntos de tamaño infinito. Podría pasar por alto la suposición de que $x$ y $N$ deben ser números naturales, no algunos valores transfinitos. Para empezar a discutir las relaciones en los tamaños de los conjuntos, hay que hacer uso de teoría de la medida que falta en las observaciones de la OP. De ello se desprende que la definición clásica de probabilidad por proporciones (Fermat, Pascal) también es legítima sólo para espacios muestrales finitos . La definición de distribuciones de probabilidad en espacios muestrales infinitos sólo puede hacerse mediante el uso de integrales.

Considere cuidadosamente la definición de la distribución de probabilidad uniforme continua. La función de distribución acumulativa se encuentra por integración de la función de densidad de probabilidad (de Wikipedia ):

Cumulative uniform distribution

Para el OP, $a = 0$ y $b = 1$ (es decir, uniforme estándar), por lo que $f(x) = 1$ y $F(x) = x$ en el ámbito de la ayuda. Así, por ejemplo, si $x = 0.03$ entonces la probabilidad de que un segundo número aleatorio de esta distribución uniforme sea menor que $x$ es $F(0.03) = 0.03 = 3\%$ , no $50\%$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X