He construido una regresión logística clasificador que es muy exacta en mis datos. Ahora quiero entender mejor por qué funciona tan bien. Específicamente, me gustaría rango de características que están haciendo la mayor contribución (que son las características más importantes) y, a ser posible, cuantificar la cantidad de cada función es contribuir a la precisión del modelo general (o algo en este sentido). ¿Cómo puedo hacer esto?
Mi primer pensamiento fue para clasificar en función de su coeficiente, pero sospecho que esto no puede ser correcto. Si tengo dos características que son igualmente útiles, pero la propagación de la primera es diez veces más grande que el segundo, entonces yo esperaría que el primero en recibir a un menor coeficiente de la segunda. Hay una más razonable a la hora de evaluar la característica de importancia?
Tenga en cuenta que no estoy tratando de entender cómo mucho un pequeño cambio en la característica afecta la probabilidad del resultado. Más bien, estoy tratando de comprender lo valioso de cada característica, en términos de hacer la clasificación exacta. También, mi objetivo no es tanto para realizar la selección de características o la construcción de un modelo con menos funciones, sino a tratar de dar algunas "explainability" para los eruditos del modelo, por lo que el clasificador no es sólo un opacas de caja negra.