Así que, yo quiero estimar la probabilidad de que un estudiante tendrá éxito o no en un determinado principales (suponga que el éxito significa en este caso se gradúen con los principales), basado en datos de la solicitud del estudiante. Tengo un montón de registros de los últimos alumnos de datos de la aplicación y el éxito.
Soy consciente de que yo podría tratar de regresión logística, pero me gustaría saber todas mis opciones, incluidos los métodos que permiten más fácilmente para no linearities.
Si se me acaba de tratar de clasificar a los estudiantes, yo creo que se trate de un modelo SVM. Pero no sé lo fácil que es adaptar el método a la tarea de estimación de probabilidades.
EDITAR:
Gran parte de los datos categóricos. A menudo binario. Algunas de las funciones son números reales / enteros, así.