Tengo un modelo de regresión logística entrenado que estoy aplicando a un conjunto de datos de prueba. La variable dependiente es binaria (booleana). Para cada muestra del conjunto de datos de prueba, aplico el modelo de regresión logística para generar un % de probabilidad de que la variable dependiente sea verdadera. Luego registro si el valor acutal era verdadero o falso. Intento calcular un $R^2$ o ajustado $R^2$ como en un modelo de regresión lineal.
Esto me da un registro de cada muestra en el conjunto de pruebas como:
prob_value_is_true acutal_value
.34 0
.45 1
.11 0
.84 0
.... ....
Me pregunto cómo probar la precisión del modelo. Mi primer intento fue usar una tabla de contingencia y decir "si prob_value_is_true
> 0,80, adivina que el valor real es verdadero" y luego mide la proporción de clasificaciones correctas a incorrectas. Pero no me gusta eso, porque parece más bien que estoy evaluando el 0,80 como un límite, no la exactitud del modelo en su conjunto y en absoluto prob_value_is_true
valores.
Luego traté de mirar cada valor discreto prob_value_is_true, como un ejemplo, mirando todas las muestras donde prob_value_is_true
=0,34 y midiendo el % de esas muestras donde el valor acutal es verdadero (en este caso, la exactitud perfecta sería si el % de las muestras que fuera verdadero = 34%). Podría crear un puntaje de exactitud del modelo sumando la diferencia en cada valor discreto de prob_value_is_true
. Pero los tamaños de las muestras son una gran preocupación aquí, especialmente para los extremos (cerca del 0% o 100%), de tal manera que los promedios de los valores acutales no son exactos, por lo que usarlos para medir la exactitud del modelo no parece correcto.
Incluso intenté crear enormes rangos para asegurar suficientes tamaños de muestra (0-.25, .25-.50, .50-.75, .75-1.0), pero la forma de medir la "bondad" de ese % del valor real me deja perplejo. Digamos que todas las muestras donde prob_value_is_true
está entre 0,25 y 0,50 tienen un promedio acutal_value
de 0,45. ¿Es eso bueno ya que está en el rango? ¿Malo ya que no está cerca del 37.5% (el centro del rango)?
Así que estoy atascado en lo que parece que debería ser una pregunta fácil, y esperando que alguien pueda señalarme un recurso o método para calcular una estadística de precisión para un modelo de regresión logística.
0 votos
Creo que el ejemplo de los rangos: (0-.25, .25-.50, .50-.75, .75-1.0) tienen sentido. ¿Sería útil si se reducen los rangos? Por ejemplo: 0-.03, .03-.06, .06-.09,..... es decir, cada .03. Esto podría ser útil para las regiones con muchos puntos de datos.