Estoy tratando de encontrar un enfoque para la detección de la estafa de los anuncios en mi sitio web. Creo que el problema tiene mucho en común con la detección de spam de correo electrónico (para que un clasificador Bayesiano ingenuo es una solución común) ya que muchas de las señales que indican una estafa en la que se encuentra en el texto del anuncio.
Sin embargo, hay algunas otras piezas de información que puede ser buena estafa de los indicadores, pero no estoy seguro de si/cómo un clasificador de Bayes podría hacer uso de ellos, porque implican valores numéricos (con valores en los extremos de la gama de los sospechosos), en lugar de simples valores binarios correspondientes a la presencia o ausencia de una palabra en el texto.
Por ejemplo, muchos estafa anuncios en el precio del elemento muy bajos (para atraer a un montón de puntos de vista), así que me gustaría más bajos que el precio normal para ser un fuerte indicador de que el anuncio puede ser una estafa.
Es de Bayes todavía un buen ajuste para mi requisito, si no, entonces podría recomendar un enfoque diferente?