55 votos

Con respecto a un experimento de lanzamiento de moneda por Neil DeGrasse Tyson, y su validez.

En una de sus entrevistas, Enlace del Clip, Neil DeGrasse Tyson habla sobre un experimento de lanzamiento de moneda. Es algo así:

  1. Alinea a 1000 personas, a cada una se le da una moneda, para ser lanzadas simultáneamente
  2. Pide a cada uno que lance si cara la persona puede continuar
  3. Si la persona obtiene cruz está fuera
  4. El juego continúa hasta que queda 1* persona

Él dice que el "ganador" no debería sentirse demasiado sorprendido o afortunado porque ¡habría otro ganador si volviéramos a hacer el experimento! Esto lo lleva a hablar sobre nuestro lugar en el Universo.

Sin embargo, me di cuenta de que no necesariamente tiene que haber un ganador, ¡y que el ganador debería sentirse afortunado y sorprendido! (Porque las últimas, digamos, tres personas pueden obtener todas cruz)

Luego, realicé un experimento escribiendo un programa con los siguientes parámetros:

  1. Sesgo de la moneda: 0.0001 - 0.8999 (8999 valores)
  2. Número de personas: 10000
  3. Número de veces que se ejecutó el experimento por Sesgo: 1000

Tracé la Probabilidad de 1 Ganador vs Sesgo

insertar descripción de la imagen aquí

La gráfica fue interesante con un zigzag para un sesgo bajo (para cara) y una más suave después de p = 0.2. (Además, hay un 73% de probabilidad de un solo ganador para una moneda justa).

¿Existe una expresión analítica para la función $$f(p) = (\textrm{probabilidad de $1$ ganador con una moneda de sesgo $p$}) \textbf{?}$$

Intenté hacer algo y llegué aquí: $$ f(p)=p\left(\sum_{i=0}^{e n d} X_i=N-1\right) $$ donde $X_i=\operatorname{Binomial}\left(N-\sum_{j=0}^{i-1} X_j, p\right)$ y $X_0=\operatorname{Binomial}(N, p)$

40voto

ND Geek Puntos 880

Se sabe (para un conjunto no vacío de humanos) que cuando $p=\frac12$, no hay probabilidad límite. Presumiblemente el análisis puede haber sido extendido a otros valores de $p$. Más sorprendentemente aún, ¡la razón por la que sé esto es porque termina teniendo una aplicación en teoría de números! En cualquier caso, una referencia para la inexistencia de este límite es Raíces primitivas: una encuesta por Li y Pomerance (ver la sección "La fuente de la oscilación" que comienza en la página 79). A medida que el número de monedas aumenta hacia el infinito, la probabilidad de ganar (cuando $p=\frac12$) oscila entre cerca de $0.72134039$ y cerca de $0.72135465$, una diferencia de alrededor de $1.4\times10^{-5}$.

31voto

David Moews Puntos 11543

Hay una fórmula bastante simple para la probabilidad de un único ganador, aunque implica una suma infinita. Para derivar la fórmula, supongamos que hay $n$ personas, y que sigues lanzando la moneda hasta que todos estén fuera, ya que todos obtuvieron colas. Entonces deseas la probabilidad de que en el momento antes de que todos estén fuera, solo quede una persona. Si $p$ es la probabilidad de que la moneda caiga cara, para encontrar la probabilidad de que esto suceda después de $k+1$ pasos con solo la persona $i$ restante, puedes multiplicar la probabilidad de que la persona $i$ sobreviva durante $k$ pasos, que es $p^k$, por la probabilidad de que salga en el $k+1^{\rm st}$ paso, que es $1-p$. También debes multiplicar esto por la probabilidad de que ninguno de los otros $n-1$ personas sobreviva durante $k$ pasos, que es $1-p^k$ para cada uno de ellos. Multiplicar estas probabilidades juntas da $$ p^k (1-p) (1-p^k)^{n-1} $$ y sumando sobre las $n$ opciones posibles para $i$ y todos los $k$ da $$ f(p)= (1-p)\sum_{k\ge 1} n p^k (1 - p^k)^{n-1}.\qquad\qquad(*) $$ (Se asume que $n>1$, por lo que $k=0$ es imposible.)

Ahora, el sumando en (*) se puede aproximar por $n p^k \exp(-n p^k)$, así que si $n=p^{-L-\epsilon}$, $L\ge 0$ grande e integral, $0\le \epsilon \le1$, $f(p)$ será aproximadamente $$ (1-p) \sum_{j\ge 1-L} p^{j-\epsilon} \exp(-p^{j-\epsilon}) $$ y podemos aproximar aún más esto sumando sobre todos los enteros: si $L$ se vuelve grande y $\epsilon$ se acerca a algún $0\le \delta \le 1$, $f(p)$ se acercará a $$ g(\delta):=(1-p)\sum_{j\in\Bbb Z} p^{j-\delta} \exp(-p^{j-\delta}). $$ El promedio de esto sobre $\delta$ tiene la fórmula simple $$ \int_0^1 g(\delta) d\delta = (1-p)\int_{\Bbb R} p^x \exp(-p^x) dx = -\frac{1-p}{\log p}, $$ que es $1/(2 \log 2)\approx 0.72134752$ si $p=\frac 1 2$, pero como otros han señalado, $g(\delta)$ oscila, por lo que el límite grande de $n$ para $f(p)$ no existirá. Puedes expandir $g$ en una serie de Fourier para obtener $$ g(\delta)=-\frac{1-p}{\log p}\left(1+2\sum_{n\ge 1} \Re\left(e^{2\pi i n \delta} \,\,\Gamma(1 + \frac{2\pi i n}{\log p})\right) \right). $$ Como $\Gamma(1+ri)$ disminuye exponencialmente a medida que $|r|$ se hace grande, la amplitud pico a pico de la mayor oscilación será $$ h(p):=-\frac{4(1-p)}{\log p} \left|\Gamma(1+\frac{2\pi i}{\log p})\right|, $$ que, como ya se ha señalado, es $\approx 1.426\cdot 10^{-5}$ para $p=1/2$. Para algunos $p$ más pequeños será mayor, aunque para $p$ muy pequeños, disminuirá a medida que el valor de la función gamma se acerque a 1 y $|\log p|$ aumente. Esto no significa que la oscilación general desaparezca, ya que otros términos en la serie de Fourier serán significativos. Para ilustrar esto, aquí hay algunos gráficos de $g(\delta)$. De arriba a abajo, los valores de $p$ son $0.9$, $0.5$, $0.2$, $0.1$, $10^{-3}$, $10^{-6}$, $10^{-12}$ y $10^{-24}$. A medida que $p$ se vuelve pequeño, $$ g(0)=(1-p)\sum_{j\in\Bbb Z} p^{j} \exp(-p^{j}) \ \ \qquad {\rm se acerca a} \ \ \qquad p^0 \exp(-p^0) = \frac 1 e. $$

Gráficos de g(delta)

Referencias

12voto

Un comentario extendido:

Dudo que haya una expresión analítica, aunque habrá una recursión para un número finito de jugadores iniciales. También sospecho que puede no haber un límite para una probabilidad dada de caras a medida que aumenta el número de jugadores iniciales.

Estas son las probabilidades para hasta $10000$ jugadores iniciales cuando se usa una moneda justa con $(p=0.5)$. Las probabilidades redondeadas de terminar con un solo jugador restante están cerca de $0.72135$, pero el gráfico no es persuasivo de que haya un límite único.

Sospecho que tus observaciones en zigzag resultan de esta fluctuación: $10000$ jugadores pueden estar cerca de la cima de la curva para algunas probabilidades de caras y cerca de la parte inferior para probabilidades de caras cercanas.

introducir descripción de la imagen aquí

dibujado con R:

pheads <- 0.5 
maxn <- 10000
pwin <- 1
for (n in 2:maxn){
  pwin[n] <- sum(dbinom(1:(n-1), n, pheads) * pwin) /(1-dbinom(n, n, pheads)) 
  }
midright <- mean(pwin[(maxn/2):maxn])
rangeright <- max(pwin[(maxn/2):maxn]) - min(pwin[(maxn/2):maxn])
plot(pwin, ylim=c(midright-rangeright, midright+rangeright), type="l")

Con una probabilidad menor de caras, digamos $0.1$, el rango de las fluctuaciones es considerablemente más amplio:

introducir descripción de la imagen aquí

7voto

konofoso Puntos 121

Parece que ya hay grandes respuestas a esta pregunta, pero quería intentarlo yo también.

Cuando vi el video sobre el juego de lanzamiento de monedas, lo primero que se me ocurrió fueron las siguientes ideas:

  • Supongamos que en un juego, ¿qué pasa si todos los jugadores obtienen Cola en el primer lanzamiento (es decir, ronda=1)? ¿Significa esto que no hubo ganadores?
  • Supongamos en algún otro juego, ¿qué pasa si en la ronda=5 quedan 41 jugadores y luego en la ronda=6, todos los jugadores obtienen Cola? ¿Significa también que no hay ganadores?

Para mí, parece que en este juego de lanzamiento de monedas, no siempre puede haber un ganador.

Estaba curioso y escribí una simulación en R yo mismo.

Primero, definí una función para ejecutar el juego de lanzamiento de monedas que se describió en el video:

simulate_game <- function(num_players, p_heads) {
  results <- data.frame(player = paste0("player", 1:num_players))
  status <- rep("playing", num_players)
  seen_tails <- rep(FALSE, num_players)
  round <- 1

  # simulación
  while (sum(status == "playing") > 1) {
    coin_flips <- ifelse(runif(num_players) < p_heads, "heads", "tails")
    seen_tails <- ifelse(coin_flips == "tails", TRUE, seen_tails)
    current_round <- ifelse(status == "playing", coin_flips, "eliminated")
    status <- ifelse(seen_tails == TRUE, "eliminated", status)
    results <- cbind(results, current_round)
    colnames(results)[ncol(results)] <- paste0("round_", round)
    round <- round + 1
  }

  # si solo queda un jugador jugando, declararlo como ganador
  if (sum(status == "playing") == 1) {
    winner_index <- which(status == "playing")
    results[winner_index, ncol(results) + 1] <- "winner"
    results[-winner_index, ncol(results)] <- "eliminated"
    colnames(results)[ncol(results)] <- paste0("round_", round)
  }

  num_winners_last_round <- sum(results[,ncol(results)] == "winner")
  return(num_winners_last_round)
}

run_simulations <- function(num_players, num_simulations, p_values) {
  avg_num_winners_list <- numeric(length(p_values))

Este código analiza el número promedio de ganadores en un conjunto de juegos. A mi parecer, un juego individual puede tener $1$ ganador o $0$ ganadores. En un conjunto de $n$ juegos, el número promedio de ganadores debe estar entre $(0,1)$.

Ahora, repetí esta simulación para 1000 jugadores y diferentes valores de probabilidad de éxito para la moneda:

num_players <- 100
num_simulations <- 100
p_values <- seq(0.01, 0.99, by = 0.01)
final_results <- run_simulations(num_players, num_simulations, p_values)
print(final_results)

Finalmente, grafiqué los resultados:

library(ggplot2)
ggplot(final_results, aes(x = p, y = avg_num_winners)) +
    geom_line() +
    labs(title = "Número Promedio de Ganadores vs Probabilidad de Caras",
         x = "Probabilidad de Caras (p)",
         y = "Número Promedio de Ganadores") +
    theme_minimal()

También obtuve un gráfico con una forma similar en zig-zag:

enter image description here

Después de todo este trabajo, me di cuenta de que mi respuesta no aporta realmente nada de valor a esta pregunta ... no hay derivaciones matemáticas en mi respuesta, y usuarios anteriores han enviado simulaciones similares a la mía que parecen ser mucho más eficientes ... pero en el espíritu de las matemáticas y la curiosidad, ¡quería compartir mis ideas!

¡Excelente trabajo para el OP, todos los que publicaron una respuesta y todos los que leyeron y también pensaron en ideas!

7voto

Phy_Amatuer Puntos 46

Las simulaciones son buenas, pero si deseas resultados analíticos debes tratar este problema como una cadena de Markov. Los estados vienen dados por el número de personas restantes, desde $0$ hasta el número de personas con las que comienzas, digamos $n$.

Observa que tanto $0$ como $1$ son estados absorbentes. Queremos determinar la probabilidad de que el estado $k$ termine en el estado absorbente $1$ eventualmente. Dado que las transiciones de estados están totalmente ordenadas (ninguna persona puede volver al juego una vez que está fuera), esto se puede resolver directamente con inducción hacia atrás.

Observa además que las probabilidades de transición entre estados vienen dadas por la distribución binomial. Una transición de $n$ a $k$ con $n\geq k$ ocurre en cada paso con probabilidad $B_{n,p;k}=\binom{n}{k}p^k(1-p)^{n-k}$, donde $p \in (0,1)$ denota la probabilidad de que una moneda caiga cara, manteniendo al jugador vivo.

Con esto, podemos comenzar el proceso inductivo. Sea $w_k$ la probabilidad de que el estado $k$ eventualmente termine en el estado $1$, llevando a un ganador único del juego. Tenemos:

$w_0 = 0$

$w_1 = 1$

$w_2 = B_{2,p;2}w_2+B_{2,p;1}w_1 = p^2w_2+2p(1-p)1 \iff w_2=\frac{2p(1-p)}{1-p^2}$

...

$w_k = \sum_{i=1}^kB_{k,p;i}w_i \iff w_k=\frac{\sum_{i=1}^{k-1}B_{k,p;i}w_i}{1-B_{k,p;k}}$

Para cualquier número finito, esto produce una solución en forma cerrada ya que incluye solo un número finito de pasos de cálculo individuales. Entonces, $w_{1000}$ tiene una solución en forma cerrada, aunque probablemente sea demasiado grande para escribir fácilmente. Ahora, esto no implica que $w_n$ tenga una solución general en forma cerrada. Puede que sí o puede que no, aunque mi presentimiento es que no. El método anterior requiere un número creciente de pasos de cálculo a medida que $n$ aumenta.

El resultado exacto, por ejemplo, para $p=1/2, n=100$ es:

62679617659887749988746213470851836113741964913902528922511448994328489763653864096767507935863398677311629114459544046285444888961576667322773922896895955781629729326922709710409021226156576946745722296797445217949518127366802648645133203052528983810483052457946476329495357314994988638375847044238900492391360621033700774719462413038092652895803131646129048816076558232952576535312196097213171545111287268383567849506192874997518701482940352790757985554110002281105656215802412515704365255563332555125783287017146039591371543167955227203712515273940563538530755798767563527683205743066644698878477451964888492675903548799151412895334864392216825070288126612996964792670010845874081668809189902256199168241965557644040471946691718628884314486897229211150174267701947584366283678796661270270637735818712753244225381519788228409191793751176162361892606423059087638822626342274264795739573188/86892064279492453953188039648187133334016414403874605165793915801213956772656166517539872814657519043503730828124464647673414852936009548075772881250175976560263407433825694658916832128958154801811841312392669310267956415090926520793270433785315356585513778150072989636862246760300455530349881323266836600414981325512923835697446109043370344650170033834847719739217764180203723309543189563413799270524852652673694333430784981501004469385298881607442883928128633834952061989755616387861671386393210001155450626048953943271575507984786499318923920444756186659511566552332139050931523720014886264749259665189174978677777661807919432101541602177880774148088728531361612430544375585266902505009650854008931537438449984971759466224084364168665063565901302922285567268108340098687899223563586659152304055907858269892070717015278007341200438037828696715806927256523797229075194867698563806844410715

y la fórmula para el $p$ general para $n=10$ ya se dispara a:

10*p*(p^30 - 7*p^29 + 32*p^28 - 75*p^27 + 121*p^26 - 146*p^25 + 200*p^24 - 229*p^23 + 222*p^22 - 197*p^21 + 293*p^20 - 309*p^19 + 334*p^18 - 334*p^17 + 393*p^16 - 346*p^15 + 393*p^14 - 334*p^13 + 334*p^12 - 309*p^11 + 293*p^10 - 197*p^9 + 222*p^8 - 229*p^7 + 200*p^6 - 146*p^5 + 121*p^4 - 75*p^3 + 32*p^2 - 7*p + 1)/(p^31 + 2*p^30 + 5*p^29 + 9*p^28 + 16*p^27 + 25*p^26 + 38*p^25 + 53*p^24 + 72*p^23 + 92*p^22 + 114*p^21 + 135*p^20 + 155*p^19 + 171*p^18 + 183*p^17 + 189*p^16 + 189*p^15 + 183*p^14 + 171*p^13 + 155*p^12 + 135*p^11 + 114*p^10 + 92*p^9 + 72*p^8 + 53*p^7 + 38*p^6 + 25*p^5 + 16*p^4 + 9*p^3 + 5*p^2 + 2*p + 1)

No hay muchas esperanzas de encontrar simplificaciones concisas aquí.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X