En su clásico libro sobre el Federalist papers, Mosteller y Wallace abogan por un registro de la función de penalización: se le penalizará a ti mismo $-\log(p)$ cuando predecir un evento con una probabilidad de $p$ y se produce; la pena para que no ocurra es igual a $-\log(1-p)$. Por lo tanto, la pena es alta cuando lo que sucede es inesperado de acuerdo con su predicción.
Su argumento en favor de esta función se basa en un sencillo y natural, criterio: "la función de penalización debería alentar a la predicción de la correcta probabilidades si se conocen." Suponiendo que el total de la multa se suman a lo largo de todos los pronósticos y habrá tres o más de ellos, M&W afirmación de que el registro de la función de penalización es sólo uno (hasta transformación afín) para que la "sanción prevista es minimizado sobre todas las predicciones" por la correcta probabilidades.
Después de esto, entonces, una buena prueba para que usted use es para seguir su acumulado de registro de sanciones. Si, después de un largo tiempo (o por medio de algunos independientes de oracle), se puede obtener estimaciones precisas de lo que las probabilidades eran realmente, usted puede comparar su pena con el mínimo posible. El promedio de la diferencia de las medidas de su largo plazo el rendimiento predictivo (cuanto más bajo, mejor). Esta es una excelente manera de comparar dos o más compitiendo predictores, demasiado.