Estoy usando el clasificador naive bayes para clasificar entre los dos grupos de datos. Un grupo de los datos es mucho más grande que el otro (por encima de 4 veces). Estoy usando la probabilidad anterior de cada grupo en el clasificador.
El problema es que el resultado que obtengo tiene 0% de verdaderos positivos y la tasa de 0% de falsos positivos. Tengo los mismos resultados cuando pongo el antes de 0.5 y 0.5 .
Cómo puedo configurar mi umbral de algo mejor para que yo pudiera conseguir un mayor equilibrio en los resultados?
He tenido un problema similar cuando se utiliza la Regresión Logística clasificador. Lo resuelto por la restando el anterior plazo de bias.
Cuando yo uso el Discriminante Lineal de Fisher en estos datos, puedo obtener buenos resultados con el límite fijado en el medio.
Supongo que hay alguna solución común a este problema, yo no lo podía encontrar.
ACTUALIZACIÓN: acabo de notar que tengo el clasificador es el sobreajuste. El rendimiento en el conjunto de entrenamiento es perfecta (100% de respuestas correctas).
Si puedo usar grupos iguales, entonces el clasificador comienza la clasificación para el "pequeño" grupo así, pero el rendimiento es bastante malo (peor que FLD o LR).
UPDATE2: creo que el problema era que estaba usando completa de la matriz de covarianza. Se ejecuta con la diagonal de la matriz de covarianza me dio más "equilibrada" de los resultados.