La estimación de tamaño de muestra necesario para obtener un rendimiento óptimo de la indexación semántica latente?

Question

La estimación de tamaño de muestra necesario para obtener un rendimiento óptimo de la indexación semántica latente?

Preguntado el 5 de Abril, 2011: Cuando se hizo la pregunta
180 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Indexación semántica latente parece que funciona bien; por ejemplo, es independiente de la lengua, etc. Sin embargo, parece que el uso de la similitud de las frecuencias de los términos en el corpus para categorizarlos.

Si esta interpretación es correcta, hay una manera de medir el tamaño del conjunto de datos que va a dar un rendimiento óptimo?

Preguntado el 5 de Abril, 2011 por Tom R

Answer 1

1 Respuestas

Answer 2

3voto

Hoe Puntos 1

Antecedentes: tengo experiencia en la implementación de la LSA modelos.

Desde mi experiencia, no hay manera de predecir. La mejor manera que he encontrado es la de generar una serie de modelos basados en diferentes parámetros y prueba de ellos con un conocido de la tarea. Así que si usted quería LSA para la categorización de los documentos, se obtiene un conjunto de documentos pertenecientes a diferentes categorías (véase la Reuters 21578 o el Brown corpus ambos de los cuales están ampliamente disponibles) y preparar docs a partir de diferentes categorías. Luego de presentar a cada uno para cada modelo y ver cual es la más exacta.

También he encontrado que el contenido de los documentos también afecta el resultado no sólo del tamaño del corpus. No voy a decirte los detalles pero documentos más cortos tienden a no contribuir a un modelo de precisión.

Siento no poder ser de más ayuda en este. Yo podría estar equivocado acerca de esto, sin embargo - tratar de Google Scholar para ver si alguien ha investigado y encontrado nada útil.

Respondido el 8 de Julio, 2011 por Hoe (1 Puntos )

La estimación de tamaño de muestra necesario para obtener un rendimiento óptimo de la indexación semántica latente?

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

La estimación de tamaño de muestra necesario para obtener un rendimiento óptimo de la indexación semántica latente?

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: