2 votos

Concurso de lanzamiento de monedas de 17 semanas - Calcule la probabilidad/apuesta de que cada individuo tenga la cuenta ganadora de "Cara"

Soy nuevo en las estadísticas, como MUY nuevo. Tan verde, de hecho, que apenas estoy empujando (0,1,0) en el modelo de color RGB.

En la actualidad soy el encargado de llevar el registro de las 17 semanas de nuestra oficina "Coin flip pool". En este momento, han pasado 7 semanas y estamos en la octava, por lo que quedan 9 semanas. Cada concursante ha acumulado un cierto número de puntos ganados esencialmente lanzando 3 monedas a la semana y por cada resultado "cara", obtienen 1 punto - si obtienen 3 "caras" en una semana, son 3 puntos. Las puntuaciones actuales acumuladas por los 23 concursantes oscilan entre 7 y 15, por lo que cada uno tiene su propia media semanal de aciertos.

Un concursante preguntó recientemente cuáles eran sus probabilidades de ganar. Obviamente, esto requiere conocer su puntuación actual, su rendimiento actual, la puntuación actual de los demás concursantes, el rendimiento medio semanal de los demás concursantes y, posiblemente, la puntuación media potencial de los resultados de 3 monedas a la semana.

He buscado y rebuscado y sólo he encontrado calculadoras de probabilidades de apuestas y explicaciones básicas de cuál puede ser la probabilidad del resultado de cualquier serie, pero no sé lo suficiente sobre este tema ni qué palabras clave utilizar para poder acotar mis resultados y encontrar la respuesta correcta.

Puedo proporcionar toda una hoja de cálculo con datos (si no sé fácilmente cómo compartirlos dentro de Stack Exchange).

Como no sé casi nada de este tema, ¿podría alguien darme un empujón en la dirección correcta? Especialmente si esto termina siendo un tema demasiado complicado para una pregunta de Stack Exchange.

Gracias por su tiempo.

Editar (20181027T08:45-05:00) :

Aclaración adicional que podría simplificar esto (o no, la estadística no es mi fuerte después de todo): Saber la posibilidad absoluta de ganar al final de la semana 17 no es necesario, sólo una proyección basada en el rendimiento actual (¿tal vez sea lo mismo?). Algunos datos de muestra (datos reales de mi hoja de cálculo)

Person      Score   Performance Week 1  Week 2  Week 3  Week 4  Week 5  Week 6  Week 7  Week 8
Alpha       2       0.250       2       0       0       0       0       0       0       0
Bravo       10      1.250       2       0       0       2       1       3       2       0
Charlie     12      1.500       3       1       0       2       2       1       3       0
Delta       8       0.875       0       1       1       1       2       1       0       1
Echo        11      1.375       2       0       2       1       1       2       3       0
Foxtrot     13      1.625       1       2       2       2       2       1       3       0
Golf        9       1.125       2       1       1       1       1       1       2       0
Hotel       12      1.500       2       1       1       0       2       3       3       0
India       8       1.000       1       1       0       1       2       1       2       0
Juliett     9       1.125       2       1       1       0       1       2       2       0
Kilo        9       1.125       2       1       0       2       2       0       2       0
Lima        11      1.375       2       1       2       1       1       2       2       0
Mike        15      1.875       1       1       2       3       2       3       3       0
November    9       1.125       2       0       2       1       1       1       2       0
Oscar       12      1.500       1       2       0       2       2       2       3       0
Papa        10      1.250       1       2       1       1       0       2       3       0
Quebec      11      1.375       2       1       2       1       1       1       3       0
Romeo       7       0.875       1       1       1       0       1       1       2       0
Sierra      11      1.375       2       1       2       3       2       0       1       0
Tango       8       1.000       2       2       0       1       1       1       1       0
Uniform     8       1.000       1       1       0       2       0       0       3       1
Victor      11      1.375       2       2       1       1       1       2       1       1
Whiskey     10      1.250       2       0       3       1       1       2       1       0
X-ray       9       1.000       0       1       2       1       1       1       2       0

Puntuación: total de "cabezas" hasta ahora
Rendimiento": cabezas medias (puntuación / 8 en la actualidad)
Semana #: resultados totales de "cabezas" esa semana

Editar (20181027T09:52-05:00) :

Para los comentaristas (¿comentaristas?) que se preguntan por qué la Semana 8 tiene tan pocos éxitos: La semana 8 está "en curso" y termina el martes por la mañana. Se lanza una moneda el jueves, el domingo y el lunes, por lo que la probabilidad cambiará según el lanzamiento de cada día. Los fanáticos de los deportes estadounidenses podrían empezar a ver hacia dónde se dirige esto.

Editar (20181027T14:37-05:00) :

Como hemos comentado Martijn Weterings y yo en la sección de charlas, no se trata precisamente de un concurso de lanzamiento de monedas. Según mi posible simplificación, se trata de la temporada regular de la NFL: 17 partidos para los que hay dos resultados (y su inverso): El equipo A gana o pierde (por lo que el equipo B pierde o gana). Utilizamos una variante que ajusta la puntuación del equipo no favorito en una cantidad positiva (un hándicap, si se quiere). Basándonos en las estadísticas de la quiniela del año pasado con la inclusión de un hándicap, las probabilidades de que cualquiera de los dos equipos gane tras el ajuste de la puntuación son de 1:1 (50%, ¿sí?) -más exactamente 45,824% al promediar las medias de la hoja de la temporada pasada.

Por eso he descrito este problema como un concurso de lanzamiento de monedas. Mientras que las verdaderas probabilidades de apuestas calculan todo tipo de variables, ese trabajo se ha hecho por nosotros y para simplificar, simplemente fuimos con "el hándicap hace que cada equipo tenga la misma oportunidad de ganar el juego". Esta variante de hándicap ayuda a inmensamente porque una buena mayoría de nuestros jugadores no siguen este deporte en absoluto y serían derrotados semana tras semana por los que sí lo hacen. El hándicap es una especie de ecualizador.

Más exactamente, cada concursante selecciona tres "monedas" de un grupo de 16 y si alguna de esas "monedas" sale "cara", obtiene un punto, de 0 a 3 puntos por semana. Actualmente estamos en la octava semana y, en el momento de escribir este artículo, sólo se han lanzado dos monedas (el partido del jueves por la noche y el del sábado por la mañana). Por ello, la probabilidad puede cambiar con el tiempo, ya que no todos los 16 resultados se producen simultáneamente. Sin embargo, en aras de la simplicidad (y de nuevo no sé casi nada de estadística para decir "simplicidad" repetidamente) la probabilidad de cada participante se actualizará a medida que se completen más de estos concursos.

Pido disculpas por no haberme dado cuenta de que la verdadera realidad era menos simple que "el concursante tira 3 monedas" y más "hay un conjunto de monedas del que cada concursante 'apuesta' que saldrá cara".

2voto

jldugger Puntos 7490

Se puede obtener una fórmula relativamente sencilla, que sólo requiere sumas y productos fácilmente calculables. El esfuerzo computacional es proporcional al número de jugadores, multiplicado por el número de puntuaciones distintas que exhiben hasta el momento, multiplicado por el número de rondas restantes, multiplicado por el número de tiradas por ronda.


Establezcamos la notación:

  • Dejemos que $x=(x_1, x_2, \ldots, x_{23})$ sean las puntuaciones actuales.

  • Dejemos que $n=17 - 7 = 10$ sea el número de rondas que faltan.

  • Dejemos que el número de tiradas restantes durante esas rondas sea $m = 3*n = 30.$

  • Que la moneda tenga probabilidad $p=1/2$ de las cabezas que vienen.

Hay $m+1$ posibles puntuaciones para el jugador $j$ al final, dado por $x_j+Z_j$ donde $Z_j\in\{0,1,\ldots, m\}.$ Las posibilidades de $Z_j$ seguir un Binomio $(m,p)$ distribución.

Supongamos que el jugador $j$ termina con la puntuación $x_j+z$ con probabilidad $q$ (que podemos calcular fácilmente). En este caso, la probabilidad de que este jugador gane directamente es la probabilidad de que la puntuación final de todos los demás jugadores sea inferior a $x_j+z.$ Esto también se puede calcular fácilmente a partir de la distribución binomial, porque las puntuaciones de cada jugador son independientes, lo que hace que las probabilidades individuales se multipliquen.

Para ser claros,

  • Dejemos que $F$ sea la función de distribución acumulativa de la Binomial $(m,p)$ distribución.

  • Dejemos que $f$ sea la función de probabilidad, $$f(z) = \binom{m}{z}p^z (1-p)^{m-z}.$$

Así, para cada jugador $j$ y cualquier número posible $z,$ $\Pr(Z_j \le z) = F(z).$ En particular, hay que tener en cuenta que $$\Pr(Z_j \lt z) = F(z-1).$$

Por último, dejemos que $\mathcal{W}_j$ sea el evento "Jugador $j$ gana de forma rotunda" y $\mathcal{T}_j$ sea el evento "Jugador $j$ lazos para ganar". De lo anterior y de los axiomas de la probabilidad es inmediato que

$$\Pr(\mathcal{W}_j \mid Z_j=z) = \prod_{i\ne j} F(x_j - z - x_i - 1)$$

y

$$\Pr(\mathcal{T}_j \mid Z_j=z) = \prod_{i\ne j} F(x_j - z - x_i) - \Pr(\mathcal{W}_j \mid Z_j=z).$$

Obtenemos las probabilidades de victoria y de empate sumando todos los resultados posibles $Z_j,$

$$\Pr(\mathcal{W}_j) = \sum_{z=0}^m f(z) \Pr(\mathcal{W}_j\mid Z_j=z)$$

(y lo mismo para las corbatas).

Para el $24$ jugadores enumerados en la pregunta, este cálculo produce las siguientes probabilidades de victorias y empates (con las nueve puntuaciones únicas indicadas en la parte superior):

    2     7      8      9     10     11     12     13     15
Win 0 4e-04 0.0014 0.0041 0.0106 0.0248 0.0529 0.1038 0.3251
Tie 0 1e-03 0.0026 0.0064 0.0136 0.0259 0.0446 0.0692 0.1215

Figure: bar chart displaying the chances.

(A pesar de la presentación de los resultados por puntuaciones distintas, no hay que olvidar que las respuestas dependen de cuántos jugadores tienen actualmente cada puntuación).


También se puede simular el juego para estimar las posibilidades. Esto es perfectamente sencillo; los detalles aparecen en el código al final.

En una simulación de 10.000 continuaciones independientes, los resultados fueron estos:

    2     7      8      9     10     11     12     13     15
Win 0 5e-04 0.0015 0.0041 0.0095 0.0261 0.0544 0.1018 0.3282
Tie 0 1e-03 0.0026 0.0063 0.0120 0.0250 0.0391 0.0660 0.1150

La concordancia es buena, lo que sugiere que los cálculos originales son correctos.

Cabe destacar que (a) la suma de las posibilidades de ganar no puede superar $1$ y de hecho nunca será igual $1$ siempre que haya alguna posibilidad de empate; y (b) la suma de todas las posibilidades de ganar más las de empatar nunca será inferior a $1$ y siempre excede de $1$ siempre que exista la posibilidad de un empate a tres (o más).

Una solución mejor sería ponderar los empates de forma inversa por el número de personas que hay en cada uno de ellos, asumiendo que si la partida está empatada al final, la victoria se repartirá por igual entre todos los empatados con la mejor puntuación. Esta solución puede obtenerse utilizando las mismas técnicas, pero es combinatoriamente más complicada (requiere aplicar un enfoque de inclusión-exclusión).


Como es probable que estos cálculos deban repetirse después de cada ronda, para ayudar a ello está el R código. No está escrito de forma eficiente, porque hace repetidas llamadas para calcular $F$ (con pbinom ) y $f$ (con dbinom ). Todas estas llamadas pueden hacerse una sola vez y almacenarse en matrices, acelerando así el cálculo. Esto no cambiará el comportamiento asintótico del algoritmo y sería útil sólo para un gran número de jugadores o juegos con muchos lanzamientos de moneda por delante.

#
# Inputs.
#
x <- c(2,10,12,8,11,13,9,12,8,9,9,11,15,9,12,10,11,7,11,8,8,11,10,9) # Current scores
n <- 17 - 7            # Number of rounds left
n.flip <- 3            # Flips per round
p <- 1/2               # Chance of success per flip
#
# Derived quantities.
#
n.players <- length(x)        # Number of players
m <- n.flip * n               # Number of flips to go
z <- 0:m                      # Possible outcomes for any player
prob <- dbinom(z, n.flips, p) # Their chances
#
# Compute individual chances of wins and ties. 
# 
scores <- sort(unique(x))
chances <- sapply(scores, function(score) {
  j <- min(which(x == score))
  y1 <- sapply(0:m, function(k) {
    exp(sum(pbinom(x[j] + k - x[(1:n.players)[-j]], m, p, log.p=TRUE)))
  })
  y <- sapply(0:n.flips, function(k) {
    exp(sum(pbinom(x[j] + k-1 - x[(1:n.players)[-j]], m, p, log.p=TRUE)))
  })
  c(Win=sum(prob * y), Tie=sum(prob * (y1-y)))
})
#
# Check with a simulation.  It will do a few thousand iterations per second.
#
set.seed(17)
sim <- replicate(1e4, {
  Z <- rbinom(n.players, m, p) # The future results
  final <- x + Z               # The final scores
  scores <- table(final)       # The unique final scores
  k <- length(scores)
  if (scores[k]==1) {
    Win <- final == max(final) # Tally who wins
    Tie <- rep(0, n.players)
  } else {
    Tie <- final == max(final) # Tally who ties
    Win <- rep(0, n.players)
  }
  rbind(Win, Tie)
})
sim <- apply(sim, 1:2, mean)   # Average over the iterations
#
# Display the results.
#
colnames(chances) <- paste(scores)
scores <- sort(unique(x))

sim <- sapply(scores, function(score) sim[, min(which(x==score))])
colnames(sim) <- paste(sort(unique(x)))

print(round(sim, 4))
print(round(chances, 4))

0voto

user164061 Puntos 281

modelado

Puede modelar esto como un modelo de regresión binomial donde las probabilidades/probabilidades son funciones del jugador y del tiempo (se añade el tiempo ya que parece haber un efecto temporal).

Hay varias formas de hacerlo. Esa es la parte complicada y podrías investigar primero qué modelo sería el mejor. Pero digamos que utiliza un modelo logístico . Entonces, la parte lineal puede modelarse como una función polinómica en la que se elige el orden en función del que tenga la mayor probabilidad logarítmica penalizada (por ejemplo aic ).

Además, para obtener mejores predicciones es necesario tratar los efectos para los jugadores como alguna variable aleatoria (podrías utilizar un modelo mixto). De este modo, se obtiene un efecto de contracción (digamos que se incorpora regresión a la media ), lo que permitirá mejorar las predicciones.

Predicción de

Dado el modelo se pueden predecir nuevos valores. Esto es un poco difícil, ya que has modelado la función que define una probabilidad para una cabeza/cola, y no las cabezas/colas en sí mismas. Podrías hacer, para obtener distribuciones de resultados en la semana 17 para cada participante:

  • simulaciones monte carlo
  • alguna solución computacional de la integral (para cada semana necesitas calcular todos los valores posibles para la probabilidad, que es una variable continua pero podrías discretizarla, y para cada una de estas probabilidades necesitas resolver las probabilidades para un resultado particular en número de cabezas)
  • Posiblemente pueda evaluar las funciones analíticamente (lo dudo sin embargo, obtendrá algunos Distribución binomial de Poisson con un número molesto de términos y esos mismos términos también se distribuyen según el error de su modelo en lugar de ser constantes )

    O podrías encontrar alguna aproximación al resultado.

Basándose en las distribuciones de cada individuo (y asumiendo que los resultados de los individuos son independientes) se puede calcular la probabilidad de que un individuo vaya a ganar sumando todos los resultados de un individuo; sumando la probabilidad de ese resultado multiplicada por las probabilidades de que los otros no tengan un resultado igual o superior.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X