Si he entendido bien, usted puede tener muchos datos para la clase a (auth.) y casi todos los de la clase B (impostor) en su (elegidos al azar?) conjunto de entrenamiento?
De Wikipedia (Pseudocount),
En cualquier observado conjunto de datos o muestra de que existe la posibilidad, especialmente con baja probabilidad de eventos y/o pequeños conjuntos de datos, de un posible evento no ocurra. Su frecuencia observada es, por tanto, cero, al parecer, lo que implica una probabilidad de cero. Esto es una simplificación, que es inexacta y, a menudo ineficiente, especialmente en la probabilidad basada en la máquina de aprendizaje de técnicas como las redes neuronales artificiales y modelos ocultos de Markov. Por artificialmente el ajuste de la probabilidad de raro (aunque no imposible) eventos por lo que esas probabilidades no son exactamente cero, se evita la frecuencia cero problema. Ver también Cromwell regla.
Así que me gustaría por lo tanto artificialmente incluyen algunos datos para el otro, muy raros de la etiqueta de clase.