Tengo un problema de clasificación, con unas 10 entradas diferentes, algunas booleanas, otras categóricas (y no relacionadas entre sí), algunas siendo un flotador entre 0 y 1, que necesitan ser mapeadas a 4 salidas diferentes.
Mi problema es que la cantidad de datos que tengo es relativamente limitada. Tengo unos 10.000 puntos de datos.
¿Qué tendría más sentido aquí? ¿Árboles potenciados o una red neuronal? Me pregunto si tiene sentido utilizar una red neuronal, dado que el entrenamiento de una NN parece requerir muchos más datos.
Tenga en cuenta que no quiero usar SVM, k-means, etc, idealmente quiero hacer uno de estos dos métodos.
¿Qué parámetros sugeriría también? ¿Como el número de árboles/hojas? ¿Número de capas ocultas? Sé que gran parte se reduce a la experimentación, pero ¿cuáles son los valores iniciales buenos/probados para obtener buenos resultados?