Hola compañeros de números
Quiero generar n puntuaciones aleatorias (junto con una etiqueta de clase) como si hubieran sido producidas por un modelo de clasificación binario. En detalle, se requieren las siguientes propiedades:
- cada puntuación está entre 0 y 1
- cada puntuación se asocia a una etiqueta binaria con valores "0" o "1" (esta última es la clase positiva)
- la precisión global de las puntuaciones debe ser, por ejemplo, de 0,1 (<- parámetro del generador)
- la relación de las puntuaciones con etiqueta "1" debe ser mayor que la precisión global en la sección superior y menor en la sección inferior (<- la "calidad del modelo" debe ser también un parámetro del generador)
- las puntuaciones deben estar de tal manera que la curva roc resultante sea suave (y no, por ejemplo, que un grupo de puntuaciones con etiqueta "1" esté en la parte superior y el resto de las puntuaciones con etiqueta "1" esté en la parte inferior de la lista).
¿Alguien tiene una idea de cómo enfocar esto? ¿Quizás mediante la generación de una curva roc y luego generando los puntos a partir de esa cura? Gracias de antemano.