6 votos

Cómo la tasa de sucesivas predicciones de los resultados de un evento que se realizan mientras se está llevando a cabo?

Considere el escenario de sucesivas predicciones sobre el resultado de un evento deportivo, mientras que se está llevando a cabo. Voy a utilizar el tenis como un ejemplo concreto, porque ha definido claramente los momentos en los que es sensible a realizar una nueva predicción (es decir, después de cada punto se juega), pero también estoy interesado en casos como el fútbol, donde se pueden hacer predicciones con frecuencia arbitraria (por ejemplo, cada cinco segundos).

Después de cada punto del partido de tenis que se juega a un modelo de hace una predicción de dar la probabilidad de que cada jugador va a ir a ganar el partido. En un partido con $N$ de los puntos jugados, $N$ predicciones son hechas y mi pregunta es ¿cómo debe el comportamiento de estos $N$ predicciones resumirse en la idea de dar un valor único para el rendimiento del modelo en este partido?

Un punto de partida obvio sería el Brier Score, es decir, la media del error cuadrado de las predicciones. Sin embargo, este enfoque puede no ser adecuadamente sancionar a los valores atípicos (por ejemplo, un único terrible predicción entre los buenos. En el otro extremo, el error absoluto máximo que podría favorecer siempre a un mediocre conjunto de predicciones a través de un conjunto de muy buenas predicciones y una terrible profecía.

Cuál de estas posibilidades es más tolerable está abierto a debate, pero me parece que han descrito un problema general con el resumen de estadísticas. Lo que estoy más interesado en aprender acerca de los enfoques que están específicamente adaptados a mi escenario, es decir, que tome en cuenta el hecho de que estas predicciones se realizan en el mismo resultado, y cada predicción se realiza con cada vez más información.

3voto

Jeff Bauer Puntos 236

Lo que estoy más interesado en aprender acerca de los enfoques que están específicamente adaptados a mi escenario, es decir, que tome en cuenta el hecho de que estas predicciones se realizan en el mismo resultado, y cada predicción se realiza con cada vez más información.

Esa es la clave: para su predictor para ser aceptable, se debe obtener mejor cuanto más cerca estamos del final del partido, debido a que se usa más y más información. Para solicitar una modificación de Brier score lógica, vamos a $o_F$ ser un binario $\{0,1\}$ lo que representa el resultado final del juego (digamos, "$1$ " = el jugador a gana), $I_k$ ser el conjunto que contiene información disponible hasta e incluyendo eventos como el de la etapa de $k$ del juego, y vamos a $f_k(o_F=1\mid I_k)$ ser la predicción de la probabilidad de que Un jugador va a ganar, teniendo en cuenta esta información. Entonces podemos definir una "acumulativa" Brier-como la puntuación, como

$$BS_k = \frac 1k\sum_{i=0}^k \Big(f_i(o_F=1\mid I_i) - o_F\Big)^2 \qquad k=0,...,N$$

(He incluido ${k=0}$ para cubrir la predicción antes de empezar el juego). A continuación, una demanda razonable para un buen predictor es que la secuencia de $\{BS_k\}$ estar disminuyendo. La comparación de dos competidores predictores equivaldría a comparar sus tasas de disminución.

Fácilmente se podría tratar también de una "ventana móvil" de la expresión, donde algunas de las pasadas información se descarta si se convierte en "la edad suficiente" - depende de qué tipo de información que se considere relevante en la predicción de los resultados, y finalmente se incluyen como datos de entrada para su predictor.

Por supuesto, si su predictores son seres humanos, no es necesario averiguar sus funciones de predicción - usted acaba de registrar sus predicciones y comparar entre ellos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X