Un experimento de pensamiento interesante que implica lanzar una moneda justa se está difundiendo en X/Twitter:
Lanza una moneda justa 100 veces, lo que da una secuencia de caras (H) y cruces (T). Por cada HH en la secuencia de lanzamientos, Alice obtiene un punto; por cada HT, Bob lo hace, entonces por ejemplo para la secuencia THHHT Alice obtiene 2 puntos y Bob obtiene 1 punto. ¿Quién es más probable que gane?
La respuesta, que Bob es más probable que gane, parece contraintuitiva. Por supuesto que puedo resolver el problema por fuerza bruta para mostrar que 'Bob' es la respuesta correcta - parece estar relacionado de alguna manera con Bob teniendo una varianza más baja que Alice. Pero me resulta difícil ver por qué las varianzas difieren.
library(dplyr)
sim.flip = function(X){
s2 = sample(x = c(0,1),size = X,replace = T) %>% as.character() %>% as.matrix()
s3 = s2 %>% matrix(ncol = 2,byrow = T)
s4 = s2[-c(1,X)] %>% matrix(ncol = 2,byrow = T)
s5=apply(s3,1,function(X){paste(X,collapse="",sep="")})
s6=apply(s4,1,function(X){paste(X,collapse="",sep="")})
A = length(grep(x = s5,pattern = "00") )+
length(grep(x = s6,pattern = "00"))
B = length(grep(x = s5,pattern = "01"))+
length(grep(x = s6,pattern = "01"))
return(data.frame(A=A,B=B))
}
set.seed(12345)
sims = sapply(c(1:10000),function(X){sim.flip(X=100)}) %>% unlist() %>% matrix(ncol = 2,byrow = T) %>% as.data.frame()
colnames(sims) = c("Alice","Bob")
sims$winner = ifelse(sims$Alice > sims$Bob,yes = "Alice","Bob")
sims$winner[sims$Alice == sims$Bob] = "Empate"
table(sims$winner)
Alice Bob Empate
4626 4791 583
# El valor esperado es el mismo
mean(sims$Alice)
[1] 24.7837
mean(sims$Bob)
[1] 24.7572
# La varianza difiere
var(sims$Alice)
[1] 30.36575
var(sims$Bob)
[1] 6.229471