1 votos

¿Qué medidas de evaluación utilizar para la predicción de partidos?

Estoy intentando predecir victorias/derrotas de partidos de tenis mediante la predicción de probabilidades de victoria de cada partido, y actualmente estoy pensando qué medidas de evaluación utilizar.

Además de utilizar medidas de evaluación globales como la puntuación Brier, examino la calibración del modelo y la capacidad de discriminación por separado. Tengo dudas sobre qué métricas es bueno utilizar para la discriminación de modelos específicamente.

He leído que para evaluar la discriminación de modelos se suele utilizar el AUROC. Sin embargo, creo que no es adecuado para mi aplicación, ya que no tiene sentido considerar umbrales distintos de 0,5. Además, medidas como la precisión/recuperación/puntuación F1 no parecen apropiadas debido a que mis clases están equilibradas (ganan o pierden, y ambas ocurren el 50% de las veces, por supuesto) y al hecho de que los falsos positivos tienen una importancia similar a los falsos negativos.

Por lo tanto, creo que utilizar simplemente la precisión de la predicción (fracción de victorias/pérdidas predichas correctamente) es una buena métrica para evaluar la discriminación del modelo. ¿Es correcto mi razonamiento? ¿Me he perdido algo? ¿Hay algún inconveniente en utilizar la precisión en esta aplicación?

1voto

Marcos Puntos 36

Tiene razón en que la precisión es una métrica adecuada. En tu caso, la distinción entre positivos y negativos es arbitraria, por lo que la precisión y el recuerdo no tendrían mucho sentido en mi opinión.

No conozco el contexto de tu problema, pero si por ejemplo se trata de apuestas sobre partidos, también puedes medir el rendimiento en la rentabilidad esperada.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X