4 votos

Calcular las probabilidades de un partido de cricket

Estoy escribiendo un programa para ayudarme a apostar en el cricket, pero me he encontrado con un pequeño problema.

Ya tengo un montón de datos de partidos anteriores y he recopilado varias estadísticas a partir de ellos. He calculado que después de 1 over de un partido de 20, la puntuación media es de 4,5 carreras, y la puntuación media final será de 145. Asumiendo que la desviación estándar es de 2 y 20 respectivamente.

Así que a partir de ahí puedo tener una idea bastante decente de las probabilidades para el número de carreras después de 1 over, y al final de las entradas. (Asumiendo distribuciones normales N(4.5, 2) y N(145, 20))

Mi problema es, supongamos que después de la primera bola, anotan 1 carrera. ¿Cómo puedo calcular las nuevas probabilidades?

Al principio pensé en tomar 4,5/6 (número de bolas en un over) = 0,75 como valor "esperado por bola" y luego decir, 1 carrera anotada es 1,33 veces más de lo esperado, por lo tanto escalar la puntuación final esperada a 145*1,33 ~= 200 , y la puntuación del over a 4,5*1,33 = 6.

Sin embargo, esto va a dar lugar a todo tipo de problemas: En primer lugar, si anotan 0 en la primera bola, se espera que anoten 0 en total, lo que no puede ser correcto. En segundo lugar, al multiplicar 145 por 1,33 se obtienen casi 200 carreras, un salto que no se puede justificar después de ver una sola bola.

Así que estoy un poco atascado, sin saber a dónde ir desde aquí.

Lo siento si es un poco complicado, ¡éste puede ser sólo para los entusiastas del cricket!

12voto

Ankur Loriya Puntos 160

¿Por qué no tratas cada entrega como independiente de las demás, y utilizas carreras por bola en lugar de carreras por over? Si dices que el número de carreras anotadas por bola en el primer over tiene un valor esperado de $0.75$ , por ejemplo, después de anotar $1$ de la primera bola, hay $5$ bolas restantes en el over, por lo que su puntuación esperada en el over es $1+ 0.75*5 = 4.75$ . Entonces su total esperado ha subido en $0.25$ también corre.

(Nota: si utilizas la distribución normal, el número de carreras anotadas (de una bola o de un over) podría ser negativo, y suponer que las entregas o los overs son independientes unos de otros es probablemente un error. Modelar el cricket es interesante, pero yo no apostaría dinero real por el resultado si se utilizan supuestos como estos).

4voto

matt Puntos 11

Parece que tienes muchos datos, pero aún no tienes un modelo.

¿Qué se aprende de la $1$ ¿una carrera anotada por un balón? Hay muchas posibilidades. Podrías aprender lo que pasó en esa bola. Podrías aprender algo sobre el bateador. Podrías aprender algo sobre el jugador de bolos. Podrías aprender algo sobre los niveles generales de habilidad de los equipos. Todas estas son posibilidades de acuerdo con las elecciones particulares de los modelos. Como tienes muchos datos, puedes probar estas posibilidades con los datos. Filtra los juegos pasados a aquellos en los que hubo $1$ carrera anotada en la primera bola. ¿Cómo afecta esto a las puntuaciones medias de los partidos? Algunos modelos serán inconsistentes con los datos. Mi opinión es que los equipos no son tan consistentes como para que una buena primera bola determine mucho sobre el partido, y que principalmente se puede aprender un poco sobre el bateador, y un poco sobre el lanzador.

Así pues, elabore algunos modelos sobre cómo podrían diferir los equipos y pruébelos con los datos.

1voto

Ted Puntos 854

Este es un buen problema para ver a través de un lente de serie de tiempo. En efecto, se trata de pronosticar X entregas en el futuro. Al principio no se tiene más información que la de los partidos anteriores, aunque debe haber formas de determinar qué partidos son los más relevantes.

Cada entrega adicional que se obtiene es una observación real en una serie temporal que puede utilizarse para perfeccionar el modelo.

1voto

John Richardson Puntos 1197

Podría ser una buena idea buscar los detalles del esquema Duckworth Lewis utilizado para decidir el ganador de un partido afectado por la lluvia. Se trata de un método no paramétrico que intenta calcular un objetivo justo para las entradas restringidas. La comparación con el objetivo de Duckworth Lewis daría una buena indicación del progreso, pero es posible que sus métodos puedan utilizarse para predecir el total de la entrada final.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X