2 votos

¿Cuál es la forma correcta de simular un ganador de división?

Así que estoy tratando de simular un ganador para cada una de las 4 divisiones de la NFL, suponiendo que todos los equipos tengan la misma capacidad . Está claro que la probabilidad de que cada equipo sea el ganador de la división es $1/4$ .

Me pregunto si la siguiente estrategia de simulación funciona. En lugar de simular cada división, clasifico aleatoriamente los 16 equipos del 1 al 16, y luego los comparo en grupos de 4. He ejecutado el código, y la probabilidad converge a 0,25, pero se necesitan 100.000 simulaciones para acercarse siquiera un poco.

Así pues, no sé si la estrategia de simulación propuesta es válida o no.

one_simu <- function() {
  rank <- sample(1:16, replace=F)
  groups <- split(rank, ceiling(seq_along(rank)/4)) # Split into 4 groups of 4
  result <- rep(0, 16)
  for (i in seq_along(rank)) {
    group_of_i <- groups[[ceiling(i/4)] ] # The group that team 1 belongs to
    if (rank[i] == max(group_of_i)) {
      result[i] <- result[i] + 1  
    }
  } 
  return(result)
}

apply(replicate(1000, one_simu()), 1, mean)
apply(replicate(100000, one_simu()), 1, mean)

4voto

swmo Puntos 1132

Es válido. Según entiendo su pregunta, decimos que todos los equipos de una división tienen las mismas probabilidades de ganar su división. Queremos saber si la probabilidad de que cada equipo sea el ganador de la división de una simulación es de 0,25.

Se asignan los números del 1 al 16 a los equipos de manera uniforme. Cada equipo será el ganador de la división si y sólo si ese equipo tiene el número más alto dentro de la división. Por simetría, esta probabilidad es de 0,25, ya que cada equipo debe tener la misma probabilidad de obtener el número más alto dentro de la división (esto viene de la forma en que los números se reparten en el primer lugar).

Su ${\tt R}$ -el código podría adelgazarse un poco. ${\tt ceiling(seq\_along(rank)/4)) } $ dará el mismo vector para cada ejecución, por ejemplo. También almacena mucha información en cada carrera, ya que lo único que realmente necesita es el equipo ganador de cada división.

Por último, dices que la convergencia parece algo lenta. El ritmo será el mismo si hace la simulación de forma más directa (sólo simular para una división cada vez): las probabilidades (verdaderas) son ciertamente las mismas y los resultados de la división son también para su método independientes de otras divisiones, incluso dentro de una simulación. Un argumento heurístico de esto es decir que no importa lo que usted sabe acerca de las otras divisiones, dentro de una división cuatro números han sido distribuidos y sólo su orden cuenta. Así, la información sobre las divisiones 1, 2 y 3 no cambia nada para la división 4.

Al final, los dos enfoques de la simulación se reducen a lo mismo.

EDITADO, añadido a petición: Creo que el argumento de simetría anterior está muy bien, pero si queremos ensuciarnos las manos con números y demás, podemos hacer lo siguiente.

Todas las permutaciones (clasificaciones) tienen la misma probabilidad de ocurrir. Hay un total de $16!$ . Podemos hallar la probabilidad de un suceso simplemente contando cuántas permutaciones hay en este suceso. Digamos que el primer número de una permutación corresponde a la colocación del equipo $a$ de la División 1. Queremos contar cuántas clasificaciones tendrá el equipo $a$ como ganador de la División 1. Para contar la cantidad de clasificaciones que cumplen este criterio, podemos sumar sobre la colocación del equipo $a$ . Por lo tanto, fijar la clasificación del equipo $a$ , $i$ donde $i \in \{1,...,16\}$ . En $i$ fijo tenemos que los otros tres equipos de la División 1 tienen una clasificación menor que el equipo $a$ . Estas clasificaciones pueden elegirse en $(i-1), (i-2)$ y $(i-3)$ respectivamente. La última $12$ La clasificación no afecta a si el equipo $a$ será el ganador de la División 1, por lo que podemos distribuirlos en $12!$ diferentes maneras con el último $12$ colocaciones restantes. Esto nos da, sumando $i$ ,

$ \sum_{i=4}^{16} 12!(i-1)(i-2)(i-3) = 15!4 $ .

Naturalmente, el equipo $a$ no puede ganar con un puesto estrictamente inferior al cuarto, y estos casos se omiten. Como hemos $16!$ clasificaciones diferentes en total, esto nos da una probabilidad de $1/4$ de equipo $a$ ganar su división simplemente dividiendo el número de clasificaciones con el equipo $a$ como ganador con el número total de clasificaciones.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X