4 votos

Métodos de aprendizaje automático para la clasificación binaria

Esperaba conseguir una buena lista de alternativas a la regresión logística y a los árboles de decisión para clasificación binaria ("Sí vs. No" o "Curado vs. No curado"). Me interesa más identificar las variables asociado con el resultado que encontrar el modelo que mejor predice el resultado.

Obviamente, la regresión logística es una forma estupenda y sencilla de hacerlo. También he utilizado árboles de clasificación. Sería estupendo conocer otros métodos. ¿Podrían utilizarse también las máquinas de vectores de apoyo para esta tarea?

2voto

No creo que los svm encajen aquí, ya que las características utilizadas en este clasificador son numéricas y, por tanto, no son fáciles de interpretar. ¿Qué hay de Naive Bayes? Puede servir como clasificador binario y al mismo tiempo se puede "ver" qué características contribuyen a la decisión de clase...

¿Qué tipo de características tiene? ¿Nominales, ordinales, numéricas, ...?

2voto

trish Puntos 31

Esto es más o menos lo que hice para mi tesis de maestría. Utilicé la regresión de red elástica y pareció funcionar bien, aunque no hice ningún análisis de sensibilidad. Otras penalizaciones (lazo, probablemente incluso SCAD) también funcionarían, pero la red elástica fue la mejor para mi uso.

La cuestión también se reduce a lo que se entiende por "importante". La red elástica o la regresión del lazo, en datos centrados en la media y en la desviación estándar, seleccionarán las características individuales con el mayor efecto sobre el resultado.

Si, por el contrario, está interesado en las variables individuales que más disminuyen la precisión predictiva cuando se eliminan del modelo completo, entonces este método no será apropiado. En este caso, se ajustaría cualquier clasificador, luego para cada predictor volver a ajustar el clasificador sin ese predictor y ver cuánto cae la precisión de la predicción.

También puede utilizar la regresión aquí, pero recuerde que la regresión es no un clasificador verdadero. Más bien, estima las probabilidades esperadas de pertenencia a una clase. Si quiere o necesita un clasificador verdadero, debe utilizar una SVM o un árbol de decisión, o mejor aún un método de conjunto como AdaBoost o Random Forests.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X