2 votos

¿Qué atributos para aplicar el suavizado de laplace en el clasificador naive bayes?

Estoy leyendo el clasificador Bayes ingenuo del libro "Data mining practical machine learning tools and techniques". El ejemplo de Bayes ingenuo se da utilizando el siguiente conjunto de datos.

Weather data set

Como ( Outlook \=Overcast | Juega a \=No) tiene 0 cuentas, el libro sugiere utilizar el suavizado de Laplace. Para ello, tengo que añadir 1 al numerador y 3 al denominador (ya que hay 3 perspectivas diferentes. Entiendo esta parte).

Ahora mi pregunta es si tengo que usar el suavizado de Laplace en ( Outlook | Juega a \=Sí) también? ¿Tengo que utilizar el alisado de Laplace para otros atributos también? ¿O utilizar el alisado de Laplace sólo en los atributos que tienen un recuento suficiente de 0? (en este caso ( Outlook | Juega a \=No)).

2voto

Erno Puntos 11

Siento que esto sea ciertamente demasiado tarde para ayudarte, pero respondo por si otros encuentran la pregunta.

Cuando se utiliza el suavizado de Laplace, se debe aplicar el suavizado para todos los atributos .

Para ver por qué es importante, considere un conjunto de datos que contiene exactamente 1 instancia de un determinado atributo y 0 instancias de otro. Si sólo se aplicara el factor de suavización al atributo con 0 casos, el resultado sería una probabilidad igual para los dos atributos, aunque hubiera más casos del primero. Al añadir 1 a todos los atributos, te aseguras de que nada tenga una probabilidad completa del 0%, a la vez que mantienes la probabilidad relativa correcta.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X