2 votos

Dimensión en la incrustación lineal local (LLE)

Estoy utilizando LLE para hacer la reducción de la dimensionalidad no lineal. A mi entender, en el paso 3, el problema de eigendecomposición es con respecto a la matriz M que tiene la dimensión NxN (N es el número de puntos en el conjunto de entrenamiento). Y los vectores propios son la incrustación de baja dimensión para el punto de entrenamiento. Sin embargo, puede haber hasta N eigenvectores que la incrustación puede incluso estar en un espacio de mayor dimensión (N>m, m es la dimensión original de los ejemplos de entrenamiento).

¿Por qué es así?

Y si quiero encontrar la preimagen de la incrustación de baja dimensión o el error de aproximación para el punto de datos (la parte de información que se pierde cuando los datos son representados por la incrustación de baja dimensión), ¿hay algún algoritmo disponible?

Gracias.

0voto

user121270 Puntos 1059

puede haber hasta N vectores propios que la incrustación puede incluso estar en un espacio de mayor dimensión (N>m, m es la dimensión original de los ejemplos de entrenamiento).

¿Por qué es así?

Si se pregunta específicamente por qué esto puede suceder, entonces usted mismo lo contestó - esa es la propiedad de esta matriz.

Por supuesto, que esto tenga sentido es una cuestión completamente diferente; por ejemplo, en este artículo los autores escriben

Como discutido en Apéndice A, en el inusual caso en el que el vecinos superan en número a el entrada dimensionalidad 213 la menos cuadrados problema para encontrar las pesos hace no tiene una solución solución, y una regularización término- para ejemplo, un que penaliza el al cuadrado magnitudes de los pesos- deben ser añadirse a el reconstrucción de los costes.


Y si quiero encontrar la preimagen de la incrustación de baja dimensión o el error de aproximación para el punto de datos (la parte de información que se pierde cuando los datos son representados por la incrustación de baja dimensión), ¿hay algún algoritmo disponible?

¿A qué se refiere con esta "información"? El problema con la reducción de la dimensionalidad no lineal es que no hay una única medida que sea utilizada por todos los algoritmos, y la mayoría de ellos están diseñados para preservar diferentes tipos de estructura (por ejemplo, incluso los algoritmos que tratan de preservar la estructura local (como LLE) como Isomap utilizan diferentes pérdidas).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X