El Dr. Frank Harrell mencionó en su libro y Curso BIOS 330 que
La puntuación de exactitud utilizada para construir el modelo debe ser una puntuación continua que utilice toda la información de los datos (por ejemplo, puntuación de Brier, probabilidad logarítmica, desviación, error cuadrático medio)
Me pregunto:
- ¿En qué sentido son "continuas" estas puntuaciones? ¿Es continua cuando la vemos como un mapeo de un espacio topológico (conjunto de datos de entrada) a $\mathbb{R}$ ? ¿Cuál sería entonces la topología/métrica en el espacio de eventos?
- ¿Por qué la puntuación de Brier es mejor que "la proporción clasificada correctamente" como puntuación de precisión, ya que la puntuación de Brier también es sensible a las frecuencias relativas de la variable de resultado? Considere un modelo no informativo de predecir siempre 1 con probabilidad 1, la puntuación de Brier sería muy diferente si la verdadera prevalencia es 0,30 o 0,005. O quizás no estoy entendiendo bien la sensibilidad aquí.
- ¿Cómo elegimos entre las puntuaciones continuas? Tenemos la puntuación de Brier, la probabilidad logarítmica y la desviación para el caso de la predicción binaria. ¿Cómo decidimos cuál de ellos nos dará el "mejor" modelo?