Ingenua de un clasificador de Bayes, como el nombre sugiere, es una simple aplicación del Teorema de Bayes. Básicamente, se calcula la probabilidad de que las cantidades de interés (generalmente inadvertido, llamados parámetros o latente clases) basado en los datos observados. En el caso de que los datos observados son: noticias, fútbol y tenis. Las cantidades de interés para el que desea calcular las probabilidades son: las Noticias y los Deportes. Parece que usted está interesado en el cálculo: $P(\text{News}|\text{news}, \text{football}, \text{tennis}), P(\text{News}|\text{news}, \text{football}, \text{tennis})$.
Ahora vamos a usar el teorema de Bayes para obtener:
$$
P(\text{Noticias}|\text{noticias}, \text{fútbol}, \text{tenis}) = \frac{P(\text{noticias}, \text{fútbol}, \text{tenis}|\text{Noticias})P(\text{Noticias})}{P(\text{noticias}, \text{fútbol}, \text{tenis})}
$$
El primer término en el numerador se calcula utilizando el hecho de que dado observar la clase latente, es decir, las Noticias, los datos observados, que es de noticias, fútbol, tenis y las probabilidades son independientes (esto puede ser cuestionable la asunción, pero la respuesta depende de la materia). Usted puede usar la ley para el cálculo de la probabilties de evento independiente.
$$
P(\text{noticias}, \text{fútbol}, \text{tenis}|\text{Noticias})=P(\text{noticias}|\text{Noticias})P( \text{fútbol}|\text{Noticias})P(\text{tenis}|\text{Noticias})
$$
Proceder del mismo modo para los Deportes, obtenemos:
$$
P(\text{Deportes}|\text{noticias}, \text{fútbol}, \text{tenis}) = \frac{P(\text{noticias}, \text{fútbol}, \text{tenis}|\text{Deportes})P(\text{Deportes})}{P(\text{noticias}, \text{fútbol}, \text{tenis})}
$$
$$
P(\text{noticias}, \text{fútbol}, \text{tenis}|\text{Deportes})=P(\text{noticias}|\text{Deportes})P( \text{fútbol}|\text{Deportes})P(\text{tenis}|\text{Deportes})
$$
El denominador en ambos casos se puede calcular mediante la Ley de total probabilidad.
$$
P(\text{noticias}, \text{fútbol}, \text{tenis}) =P(\text{noticias}, \text{fútbol}, \text{tenis}|\text{Noticias})P(\text{Noticias})+ P(\text{noticias}, \text{fútbol}, \text{tenis}|\text{Deportes})P(\text{Deportes})
$$
Ahora estamos a la izquierda con sólo una probabilidad en cada caso, es decir,$P(\text{News})$$P(\text{Sports})$, respectivamente. Si sabemos que estos, cada probabilidad hasta ahora puede ser calculado. Esto puede ser determinado con base en el conocimiento previo, o en su caso podría ser proporcionados a usted.
Conectar todas las probabilidades le da las probabilidades de interés.
Un alto valor de probabilidad para una clase específica implica que el observado documento pertenece a esa clase (Noticias o Deportes). Pero, ¿cómo se decidió "¿qué tan alto es alto", depende, de nuevo, en la materia y un montón de otras cuestiones.