11 votos

Al calcular promedios, ¿por qué podemos tratar a los dados explosivos como si fueran independientes?

Estoy seguro de que estoy olvidando algo básico, pero aquí va. Los dados explosivos son una regla (casera) para algunos juegos que dice que cuando sacas el resultado máximo en un dado dado (por ejemplo, 6 en un dado de seis caras) vuelves a tirar ese dado y sumas el resultado. Si vuelves a sacar el valor máximo, vuelves a tirar y sumas eso. Esto continuará hasta que dejes de sacar el valor máximo.

A partir de aquí, surge una pregunta natural: "¿cuál es el promedio de un dado explosivo?". Con el ejemplo de un dado de seis caras, la siguiente respuesta surge naturalmente:

$3.5*+3.5*\frac{1}{6}+3.5*\frac{1}{6^2}\dots=4.2$

Esto parece ser correcto, y se mantiene a cualquier prueba empírica que se me ocurra, pero ¿por qué funciona? Quiero utilizar alguna excusa del tipo "el valor esperado es lineal y tenemos distribuciones idénticas", pero encuentro eso insatisfactorio. En particular, no entiendo por qué podemos usar los valores promedio de 3.5 cuando cada término a la derecha de ese 3.5 asume que hemos superado el promedio. No tengo dudas de que esta es la razón por la que necesitamos los términos $6^{-n}$, pero mi intuición insiste en que esto es insuficiente.

Nota: Lo que realmente quiero aquí es ver el rigor. Una respuesta ideal atacará esto desde cero, posiblemente incluso axiomáticamente. Espero que no tengamos que profundizar tanto como para usar medidas de probabilidad en conjuntos, pero al menos quiero alguna respuesta que se enfoque en qué propiedad de los promedios nos permite factorizar los dados de esta manera.

19voto

kg. Puntos 404

Otra forma de verlo:

Sea $E$ el resultado. Supongamos que lanzas el dado una vez. Puede ocurrir una de dos cosas... o bien obtienes un valor por debajo de $6$ o bien obtienes un $6$ y vuelves a empezar (a partir de este punto, por supuesto, se espera obtener un adicional $E$). Por lo tanto tenemos $$E=\frac 16\times (1+2+3+4+5)+\frac 16\times (6+E)\implies E=\frac {21}5$$ como se deseaba.

10voto

Milo Brandt Puntos 23147

Esto realmente proviene de la linealidad de la esperanza, pero debes tener mucho cuidado con a qué exactamente estás aplicando este teorema. En particular, examinemos algunas variables aleatorias. En una prueba dada (es decir, lanzas el dado hasta obtener algo que no sea $6$), definamos algunas cantidades. Primero, dejemos que $X$ sea el total logrado. Dejemos que $X_1$ sea la parte de esto debido al primer lanzamiento y $X_2$ sea la parte debida al segundo lanzamiento (que es $0$ si no hubo segundo lanzamiento) y así sucesivamente.

Luego tenemos que $X=X_1+X_2+X_3+\ldots$ notando que, casi con certeza, solo hay un número finito de términos no nulos en la suma y también - en caso de que más tarde debamos preocuparnos por problemas de convergencia - que todas estas son cantidades no negativas, por lo que estamos justificados para aplicar la linealidad de las esperanzas a esto para obtener $$\mathbb E[X]=\mathbb E[X_1]+\mathbb E[X_2]+\ldots$$ Entonces, simplemente calculamos $\mathbb E[X_n]$. Esto es directo: Hay una probabilidad de $\frac{1}{6^{n-1}}$ de que lancemos por $n$ vez y, dado que lanzamos, el lanzamiento esperado es $3.5$ como es solo un lanzamiento típico de dado. Entonces, $\mathbb E[X_n]=\frac{1}{6^{n-1}}\cdot 3.5$ como se muestra en la solución que nos da $$\mathbb E[X]=(1+1/6+1/6^2+1/6^3+\ldots)\cdot 3.5$$ Nótese que, a través de este enfoque, nunca consideramos si un dado realmente fue $6$ excepto para determinar si alcanzamos el $n$-ésimo lanzamiento - eso es porque, para calcular la esperanza, estamos dividiendo en los casos de "Lanzo este dado" y "No lanzo este dado" que no sesgan en absoluto el lanzamiento del dado. Básicamente, se nos permite imaginar, mientras calculamos cada expectativa, que este es el último lanzamiento, sin importar si obtenemos un $6$ porque no se requiere información adicional para el valor de $X_n$.

2voto

Ya Basha Puntos 130

La serie que tienes ahí representa

El valor esperado del primer lanzamiento de dado, más la probabilidad de que obtengas un segundo lanzamiento multiplicado por el valor esperado del segundo dado, más la probabilidad de que obtengas un tercer lanzamiento multiplicado por el valor esperado del tercer lanzamiento, más ...

Básicamente es lo que obtienes si escribes cuál es la expectativa directamente desde la definición, y ordenas un poco: $$ \frac16\cdot1+\cdots+\frac16\cdot 5+\frac16\cdot \left(6+ \frac16\cdot1+\cdots+\frac16\cdot 5+\frac16\cdot \left(6+ \cdots \right) \right) $$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X