4 votos

Aplicación de la fórmula de Bayes a la probabilidad de que un caballo gane, en función del jinete

Tengo un problema que me he estado rompiendo la cabeza para resolverlo y no tengo la información necesaria para saber si estoy en lo cierto o no, así que espero que me podáis ayudar. Voy a intentar hacerlo lo más sencillo y claro posible. Voy a empezar con un ejemplo de carreras de caballos y luego entrar en mi dilema

El caballo A y el caballo B van a competir entre sí en una carrera de dos caballos.

Se han enfrentado 12 veces y el caballo A ha ganado cinco veces y el caballo B ha ganado siete veces. Así que el caballo A ha ganado el 41,7% de las veces pero....

Hay dos Jockeys ROJO y AZUL

3 de 5 de esas victorias se produjeron cuando Blue Jockey montaba al caballo A. Sin embargo, Blue Jockey sólo lo montó una vez en los días en que el caballo A perdió.

Hoy el Jockey Azul está montando el caballo A, así que tenemos un 60% de posibilidades si sólo usamos ese Jockey Azul 3 de cada cinco hechos. Pero sé que tenemos que considerar la cantidad total de carreras también

Hasta ahora tengo esto entonces

P(el caballo A gana dado que el jockey azul monta) = .60 X .417 /.333

porque el 60% de 3 de las 5 victorias fueron cuando Blue estaba montando. El 41,7% de victorias en total y el 0,333 porque Blue Jockey ha montado el caballo 4 veces de las doce carreras.

¿Verdad?

Ahora es cuando mi pregunta con los cambios

Dos caballos A y B, pero cinco jockeys. Así que vamos a utilizar algunas estadísticas inventadas rápidamente por el bien del tiempo.

El caballo A tiene un 66% de posibilidades de ganar, pero cuando el Jockey Black monta el caballo A, el caballo A gana el 70,5% de las veces.

ahora se ponen los colores de los jockeys en un frasco para sacarlos y ver quién va a montar el caballo A. las siguientes son las probabilidades en % de que se saque el color

Rojo 19% Negro 21% Verde 13% Azul 37% Rosa 10%.

Sería mi fórmula para ver el porcentaje real que gana el caballo A:

 Horse A wins given Black rides = .705 X .66/.21

lo que me da 2,21 que es ¿QUÉ? ¿Qué significa eso?

Y

si se tratara de un piloto diferente, digamos rosa, y para simplificar, el mismo porcentaje de victorias, el denominador sería el 0,10

Esto me está haciendo perder el sueño, solo bromeaba (un poco) :)

4voto

tsingyue Puntos 31

Sospecho que se pregunta cómo combinar los datos de forma coherente para predecir los resultados. Voy a sugerir un enfoque para hacerlo: necesitamos un modelo estadístico para los datos observados. Por ejemplo, y siguiendo la aplicación de las carreras de caballos, supongamos que observamos los resultados de muchas carreras de caballos. En cada carrera suponemos dos caballos, el caballo A frente al caballo B, para simplificar. Cualquiera de los 5 jockeys puede montar los caballos. Tal vez el jinete nº 1 tiende a montar el caballo A más a menudo. Tal vez el jinete nº 2 sea un jinete inexperto, etc. Todo eso se verá en el análisis de los datos. Un posible modelo es la regresión logística:

$$ {\hat p}=\frac {1}{1+exp[-(\beta_0+\beta_1A_1+...+\beta_5A_5+\beta_6B_1+...+\beta_{10}B_{5})] }$$

donde $\beta_0,...,\beta_{10}$ son valores que se estimarán al ajustar el modelo a un conjunto de datos.

Para cada carrera registramos el caballo ganador y el jockey de cada caballo. Lo hacemos especificando:

$A_k=1$ si jockey $k$ montó el caballo A y $=0$ si no.

$B_k=1$ si jockey $k$ montó el caballo B y $=0$ si no.

Si codificamos los datos para que el caballo A gane y el B pierda es $=1$ y B gana y A pierde es $=0$ entonces el resultado del modelo es predecir la probabilidad de que A gane dado el jockey 3 en A y el 1 en B. Esa sería la expresión

$$ {\hat p}=\frac {1}{1+exp[-(\beta_0+\beta_3+\beta_6) ]}$$

Tenga en cuenta que el $\beta's$ puede ser negativo. En los datos reales de las carreras de caballos, el impacto de un jockey en el resultado es limitado, por lo que todas las A y B saldrán cerca de 0. Pero si tuvieran un gran efecto, los coeficientes lo indicarían. El valor de $\beta_0$ mide la habilidad de los caballos además de la de los jockeys. Si, por el contrario, lo que busca es encajar su ejemplo en un problema del tipo teorema de Baye, podría avisarnos y empezar por aquí:

http://en.wikipedia.org/wiki/Bayes%27_theorem

3voto

Mr.Spot Puntos 2554

Lleva la cuenta de tus probabilidades en una tabla:

$$ \begin{array}{c|cccccc} & \text{R} & \text{Black} & \text{G} & \text{Bl}& \text{P} &\text{Total} \\ \hline \text{A wins} & & 0.1481 & & & & 0.667 \\ \text{A loses} & & 0.0619 & & & & 0.333 \\ \text{Total} & 0.19 & 0.21 & 0.13 & 0.37 & 0.10 \\ \end{array} $$

No puedes crear probabilidades condicionales al azar y esperar que los resultados tengan sentido. Y no estás utilizando fórmulas correctas.

He colocado la información dada en la fila y la columna Total. La tabla 2x5 es la probabilidad de la intersección de los eventos de la fila y la columna. Estas 10 celdas deben sumar 1 y las sumas de la fila y la columna deben sumar. Entonces podemos rellenar 2 celdas de $ P(A \text{ wins } | \text{ Black is A's jockey})=0.705.$ Entonces $$P(A \text{ wins and Black is A's jockey})=0.705*0.21=0.1481 $$

Y 0,21-0,1481. Esas son las únicas casillas que podemos rellenar. Las únicas otras probabilidades que podemos calcular son $$P( \text{Black is A's jockey } | \text{ A wins})=0.1481/0.667=0.2220 $$ y la correspondiente para dado que A pierde.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X