En una validación cruzada de configuración (el LAZO penalizado de regresión logística), yo soy el cálculo de las AUC. Sin embargo, estoy interesado en la variabilidad de estas estimaciones sobre los pliegues (esto me dará una indicación de la estabilidad de mi modelo de selección de los pliegues).
Como tal, quiero encontrar el empírica de las AUC, en cada uno de los 10 conjuntos de validación y, a continuación, calcular la varianza sobre ellos. Esto plantea un problema, ya que a veces un conjunto de validación sólo contiene sólo las observaciones que han resultado verdadero 1 o solo observaciones que han resultado verdadero 0. No conozco una manera de calcular el AUC en un escenario.
¿Cuál sería el enfoque sensato aquí?
- Ignorar este "fold" en la cálculos relacionados con las AUC
- Dale un poco de valor, de todos modos, como 0.5
- Tal vez usted puede sugerir una manera de la aproximación de las AUC en tales casos (la adición de 1 falso observación de la otro tipo y asumir su predijo probabilidad es de 0, 0,5 y 1?)
- No trate de esta variación sobre el los pliegues de la idea.