Este es un problema de clasificación binaria. La métrica que se minimiza es el registro de la pérdida ( o la cruz de la entropía ). Yo también tengo una exactitud el número, sólo para mi información. Es un grande, muy equilibrado conjunto de datos. Muy ingenuo técnicas de predicción obtener alrededor de 50% de precisión y 0.693 registro de la pérdida. La mejor he sido capaz de raspar es el 52,5% de precisión y 0.6915 registro de la pérdida. Ya que estamos tratando de minimizar el registro de la pérdida, siempre obtenemos un conjunto de probabilidades ( predict_proba
funciones en sklearn y keras ). Eso es todo de fondo, ahora la pregunta.
Digamos que puedo usar 2 técnicas diferentes para crear 2 grupos diferentes de predicciones que han comparable exactitud y registro de la pérdida de métricas. Por ejemplo, puedo usar 2 grupos distintos de las entidades de entrada para producir 2 conjuntos de predicciones que son aproximadamente el 52% de precisión con < 0.692 registro de la pérdida. El punto es que ambos conjuntos de predicciones muestran que existe un poder de predicción. Otro ejemplo es que yo podría utilizar la regresión logística para producir un conjunto de predicciones y una red neuronal para producir el otro.
Aquí están los primeros 10 para cada conjunto, por ejemplo:
p1 = [0.49121362 0.52067905 0.50230295 0.49511673 0.52009695 0.49394751 0.48676686 0.50084939 0.48693237 0.49564188 ...]
p2 = [0.4833959 0.49700296 0.50484381 0.49122147 0.52754993 0.51766402 0.48326918 0.50432501 0.48721228 0.48949306 ...]
Estoy pensando que debe haber una manera de combinar los 2 conjuntos de predicciones en uno, para incrementar el poder de predicción. Es allí?
Yo había empezado probando algunas cosas. Por ejemplo, considero que el valor absoluto de la predicción de menos de 0,5 ( abs( p - 0.5 )
) como una señal, y cualquiera que entre p1
y p2
tenían una mayor relación señal, me gustaría utilizar ese valor. Este ligeramente logrado que yo quería, pero sólo por un estrecho margen. Y en otro caso, no parece ayudar en todo. Curiosamente no parecen destruir el poder de predicción.