15 votos

¿Cuáles son las diferencias entre el análisis semántico latente (LSA), la indexación semántica latente (LSI) y la descomposición de valor singular (SVD)?

Estos términos se mezclan mucho, pero me gustaría saber cuáles son las diferencias, si es que hay alguna.

Gracias

8voto

BBlake Puntos 310

Mientras que LSA y LSI utilizan SVD para hacer su magia, existe un método computacional y conceptualmente más sencillo llamado HAL (Hyperspace Analogue to Language) que examina el texto teniendo en cuenta los contextos anteriores y posteriores. Los vectores se extraen de estas matrices de co-ocurrencia (a menudo ponderadas) y se seleccionan palabras específicas para indexar el espacio semántico. En muchos aspectos, me parece entender que funciona tan bien como LSA sin requerir el paso matemática y conceptualmente complejo de SVD. Para más detalles, véase Lund & Burgess, 1996.

7voto

Evan M. Puntos 231

LSA y LSI suelen utilizarse como sinónimos, y la comunidad de recuperación de información suele referirse a ellos como LSI. LSA/LSI utiliza SVD para descomponer la matriz término-documento A en una matriz término-concepto U, una matriz de valor singular S y una matriz concepto-documento V de la forma: A = USV'. La página de wikipedia contiene una descripción detallada de indexación semántica latente .

6voto

Jeff Hengesbach Puntos 1639

NMF y SVD son algoritmos de factorización de matrices. Wikipedia contiene información relevante sobre el NMF .

SVD y PCA están íntimamente relacionados. Para empezar, PCA es simplemente la eigendecomposición de la correlación. SVD es una generalización de la eigendecomposición para matrices no cuadradas. Los valores singulares son la raíz cuadrada de los valores propios de la matriz multiplicados por su transposición (lo que la hace cuadrada y susceptible de eigendecomposición). Además, si la matriz es normal ( $A^*A=A A^*$ ), los valores singulares son simplemente los valores absolutos de los valores propios. En cualquier caso, los valores singulares son no negativos, y perder el signo de los valores propios es el precio que hay que pagar por poder trabajar con matrices no cuadradas.

Los demás han hablado de LSI/LSA...

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X