He utilizado la función h2o.glm() en R, que proporciona una tabla de contingencia en el resultado junto con otros estadísticos. La tabla de contingencia se titula " Tabulación cruzada basada en F1 Umbral óptimo "
Wikipedia define la puntuación F1 o puntuación F como la media armónica de la precisión y la recuperación. Pero, ¿la precisión y la recuperación no se obtienen únicamente cuando el resultado de los valores predichos de una regresión logística (por ejemplo) se transforma en binario mediante un punto de corte?
Ahora por corte recuerdo, cuál es la conexión entre la Puntuación F1 y el Umbral Óptimo. ¿Cómo se calcula el umbral óptimo? ¿Cómo se calcula el umbral óptimo de F1?
Lo siento si me he perdido algo, soy nuevo en esto de las estadísticas.