Bayes Naive de los clasificadores son una opción popular para problemas de clasificación. Hay muchas razones para esto, incluyendo:
- "Zeitgeist" - una conciencia generalizada tras el éxito de los filtros de spam hace unos diez años
- Fácil de escribir
- El clasificador modelo es rápido para construir
- El modelo puede ser modificado con los nuevos datos de entrenamiento sin tener que reconstruir el modelo
Sin embargo, se trata de "ingenuo", es decir, que asumen las funciones son independientes - esto contrasta con otros clasificadores tales como el Máximo de la Entropía de los clasificadores (que son lentos para calcular).
La independencia de la asunción normalmente no puede ser asumido, y en muchas (la mayoría?) de los casos, incluyendo el filtro de spam ejemplo, es simplemente incorrecto.
Entonces, ¿por qué el Clasificador Naive Bayes todavía se desempeñan muy bien en ese tipo de aplicaciones, incluso cuando las características no son independientes el uno del otro?