33 votos

Clasificación estadística de textos

Soy un programador sin conocimientos de estadística, y actualmente estoy buscando diferentes métodos de clasificación para un gran número de documentos diferentes que quiero clasificar en categorías predefinidas. He estado leyendo sobre kNN, SVM y NN. Sin embargo, tengo algunos problemas para empezar. ¿Qué recursos me recomiendan? Conozco bastante bien el cálculo monovariable y multivariable, así que mis matemáticas deberían ser lo suficientemente fuertes. También tengo el libro de Bishop sobre redes neuronales, pero ha resultado ser un poco denso como introducción.

1voto

Oak Puntos 1366

Naive Bayes suele ser el punto de partida para la clasificación de textos, aquí hay un artículo del Dr. Dobbs sobre cómo implementar uno. También es a menudo el punto final para la clasificación de texto porque es tan eficiente y paraleliza bien, SpamAssassin y POPFile lo utilizan.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X