2 votos

¿Cómo puedo calcular la probabilidad relativa de que cada movimiento resulte en una victoria, dados los datos históricos de victorias/pérdidas para los posibles movimientos?

Estamos en una posición del juego en la que hay que tomar una decisión. Como hay relativamente pocas posiciones de juego y movimientos posibles, hemos recogido las estadísticas de ocasiones anteriores en las que se jugó la partida y nos encontramos con la misma posición de juego.

Para cada movimiento, hemos registrado si la selección condujo finalmente a una victoria o a una pérdida.

Move     Win    Loss
 A        3      5
 B        2      4
 C        0      0
 D        0      4

Mi objetivo es seleccionar una jugada al azar, favoreciendo proporcionalmente las jugadas con más probabilidades de ganar. Así, para cada una de las jugadas posibles, me gustaría calcular la probabilidad de que esa jugada sea la más ganadora. Llamémoslas PA, PB, PC y PD. La suma de estos valores debería ser 1.

Dando los datos del ejemplo anterior, mi intuición dice:-

  • El movimiento A debería ser el más favorecido, por lo que PA es el mayor de los valores.
  • El movimiento C no tiene datos. Podría ser cualquier cosa entre siempre una pérdida y siempre una victoria. Podría tener que ser tratada como un caso especial, ya que no hay nada a partir de lo cual calcular.
  • El movimiento D parece pobre hasta ahora. Tal vez sea sólo suerte de muestreo, y con el tiempo nos encontremos con 12 victorias y 4 derrotas. Todavía hay alguna posibilidad de que sea realmente la jugada más ganadora.

Ahora se me atasca. Parece que debería calcular el ratio de victorias para cada una de las jugadas y aplicar algún factor de certeza basado en el número total de veces que se ha seleccionado esa opción para obtener una distribución que represente el ratio de victorias probable para la población subyacente. ¿Cómo puedo combinar estas distribuciones superpuestas y reducirlas a probabilidades para cada movimiento? No estoy seguro de cómo combinaría todos estos números para llegar a PA, PB, PC y PD. ¿Esto parece una reminiscencia de un ANOVA?

En el problema real puede haber entre 1 y 7 movimientos disponibles. Supongo que cualquier respuesta se puede generalizar hasta más movimientos posibles. Por si sirve de algo, el juego no es circular; habiendo hecho un movimiento nunca podemos volver a la misma posición dentro del juego. Sólo se puede alcanzar de nuevo en una nueva partida. Sin embargo, hay múltiples formas de llegar a la misma posición de juego desde el principio de la partida.

1voto

k s Puntos 101

Un gran problema es que la probabilidad de hacer un movimiento y la probabilidad de ganar después de hacer el movimiento pueden no ser independientes. En realidad, puede haber sólo una pequeña diferencia en la calidad de las jugadas, pero los buenos jugadores tienden a hacer la jugada A o, con algo menos de frecuencia, la B, mientras que los malos jugadores tienden a hacer la jugada D: los jugadores que hicieron la jugada A o la B podrían haber hecho bastante bien la jugada D también, y los jugadores que hicieron la jugada D podrían haber perdido después de hacer la jugada A o la B también.

Con el movimiento C, no es que no tengas información. Tienes la información de que en 18 partidas, nadie hizo la jugada C. Eso muestra que de 18 jugadores, nadie creyó que C era la mejor jugada. Lo que parece indicar que efectivamente no es una jugada muy buena. Para las otras jugadas, cuanta más gente eligió esa jugada, más éxito tuvo.

0voto

Jaitropmange Puntos 306

El primer paso es obtener la probabilidad de ganar condicionada a cada movimiento. Esto es simplemente la proporción victoria / (victoria + pérdida) para cada elección. En cuanto a la jugada C, se puede utilizar la probabilidad global de ganar: La partida se ha jugado 18 veces y se ha ganado 5 veces, por lo que puedes establecer su probabilidad de ganar en 5/18.

Entonces las probabilidades de ganar condicionadas a la jugada son: A = 3/8, B = 1/3, C = 5/18 y D = 0.

Es posible que quieras recopilar más datos sobre el movimiento D para descubrir si hay una probabilidad no nula. De lo contrario, en tus sorteos aleatorios nunca se seleccionará.

Lo siguiente es hacer los sorteos aleatorios. Para construir la distribución, simplemente hay que normalizar las probabilidades anteriores de forma que sumen uno. Defina x = 3/8 + 1/3 + 5/18 + 0. Entonces la probabilidad de seleccionar A = (3/8) / x. La probabilidad de seleccionar B = (1/3) / x. Etc.

0voto

nic Puntos 151

Normalmente, este tipo de problema se puede resolver regularizando la distribución de probabilidad. En resumen, se puede añadir una constante (normalmente 1 o 1/2) a las frecuencias de los resultados observados para cada condición. Así, la probabilidad de ganar tras la jugada A se calcularía como p(w|A)= (3+1) / (3+1 + 5+1) , p(w|D)= (0+1) / (0+1 + 4+1) , p(w|C)= (0+1) / (0+1 + 0+1) .

Esta solución en general funciona bastante bien. No estoy seguro de que se aplique a tu caso, pero es posible que haya situaciones en las que la probabilidad de ganar sea muy alta/baja independientemente de la jugada (por ejemplo, una partida ya ganada-perdida), o que la frecuencia observada de una jugada esté relacionada con la probabilidad de ganar si se jugara la película (por ejemplo, ningún ajedrecista empezaría una partida con, por ejemplo, A4).

Si estas o similares consideraciones son relevantes, podría ajustar las constantes añadidas a las frecuencias observadas. En el primer caso, podría ponderar la constante añadida a la probabilidad observada de ganar/perder por el resultado esperado en la posición específica (por ejemplo, si la probabilidad de ganar es de 9 sobre 10, podría añadir 0,9 a la frecuencia observada de ganar y 0,1 a la frecuencia de perder). En este último caso, puede decidir penalizar las jugadas que nunca se han elegido (por ejemplo, 0,1 a la probabilidad de ganar, 0,9 a la probabilidad de perder).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X