Estoy tratando con un supervisada clasificación binaria problema. Me gustaría utilizar el GBM paquete para clasificar a los individuos como no infectados/infectados. Tengo 15 veces más infectados de individuos infectados.
Me preguntaba si GBM modelos de sufrir en el caso de desequilibrio en el tamaño de las clases? Yo no encuentro ninguna referencias responder a esta pregunta.
He intentado ajustar los pesos mediante la asignación de un peso de 1 para los individuos no infectados y un peso de 15 a los infectados, pero he obtenido buenos resultados.