Suponga que ajusta un modelo de regresión logística y descubre que está bien calibrado, es decir, que hay una buena concordancia entre los resultados observados y las predicciones. Además, supongamos que también coincide con algunos datos de entrenamiento.
No entiendo por qué alguien se molestaría en comprobar la capacidad de las predicciones del modelo para discriminar entre los que tienen y los que no tienen el resultado. Por qué preocuparse por el área bajo la curva de la roca. ¿Por qué tiene que discriminar bien mi modelo?
¿Es cierto que una gran área bajo la curva ROC implica un modelo bien calibrado?