9 votos

Uso de auto organización de mapas para la reducción de la dimensionalidad

En los últimos días, he llevado a cabo algunas investigaciones sobre el self organizing maps, para un proyecto en la escuela. He llegado a comprender que la auto organización de los mapas se pueden utilizar para reducir el dimesionality de sus datos. Sin embargo, no entiendo cómo funciona esto. Por ejemplo, supongamos que tiene un 10x10 red de neuronas en una SOM, y su entrada es de 25-dimensional. Así que, a mi entender, habría que crear una función vectorial para cada neurona, que es también 25D. Por el momento la formación se realiza, se termina con 100 25D vectores. ¿Cómo es exactamente la reducción de las dimensiones de los datos? Se supone que tengo que estar preocupado con la ubicación de las neuronas?

Gracias!

EDIT: ya he leído la pregunta en la reducción de Dimensionalidad mediante mapa de auto-organización , pero no me siento que contesta a la pregunta que tengo.

13voto

Juriy Puntos 133

La auto organización de mapa (SOM) es un espacio de relleno de cuadrícula que proporciona una discretised de reducción de dimensionalidad de los datos.

Puedes empezar con un espacio de alta dimensión de los puntos de datos, y un arbitrario de la cuadrícula que se encuentra en ese espacio. La red puede ser de cualquier dimensión, pero normalmente es menor que la dimensión de su conjunto de datos, y es comúnmente 2D, debido a que es fácil de visualizar.

Para cada dato en el conjunto de datos, usted encuentra el más cercano punto de la cuadrícula, y "tirar" de que punto de la rejilla hacia el conjunto de datos. También tire de cada uno de los vecinos de los puntos de cuadrícula hacia la nueva posición del primer punto de la rejilla. En el inicio del proceso, tirar un montón de los vecinos hacia el punto de datos. Más adelante en el proceso, cuando la cuadrícula está empezando a llenar el espacio, se mueven menos vecinos, y esto actúa como una especie de sintonía fina. Los resultados de este proceso en un conjunto de puntos en el espacio de datos que se ajustan a la forma del espacio razonablemente bien, pero también puede ser tratado como un menor dimensión de la cuadrícula.

Este es un proceso bien explicados por dos imágenes de la página 1468 de Kohonen de 1990 papel:

Esta imagen muestra un unidimensional mapa en una distribución uniforme en un triángulo. La cuadrícula se inicia como un desorden en el centro, y poco a poco está tirado en una curva que llena el triángulo razonablemente bien, dado el número de puntos de cuadrícula:

One dimensional SOM

La parte izquierda de esta segunda imagen muestra un 2D SOM red de cerca de llenar el espacio definido por los cactus forma en la izquierda:

2D cactus SOM

Hay un video de la SOM proceso utilizando una rejilla 2D en un espacio 2D, y en un espacio 3D en youtube.

Ahora, cada uno de los puntos de datos originales en el espacio más cercano al prójimo, a la que está asignada. La cuadrícula son por lo tanto los centros de los grupos de puntos de datos. La cuadrícula proporciona la reducción de dimensionalidad.

Aquí está una comparación de la reducción de dimensionalidad mediante análisis de componentes principales (PCA), de la SOM página en la wikipedia:

SOM dimensionality reduction from en.wikipedia.org/wiki/File:SOMsPCA.PNG

Inmediatamente se observa que las dimensiones SOM proporciona un mejor ajuste a los datos, explicando más del 93% de la varianza, en comparación con el 77% de la PCA. Sin embargo, hasta donde yo sé, no hay ninguna manera fácil de explicar el resto de la varianza, como existe con PCA (utilizando dimensiones extra), ya que no hay manera impecable para desplegar los datos de todo el discreto SOM cuadrícula.

2voto

felipeduque Puntos 105

A pesar de que usted termina con más nodos que cotas de función, todavía está reducción de dimensionalidad. Tener en cuenta que inicialmente tenías un espacio 25-dimensional y, ahora, tienes los 25 dimensiones proyectadas en sólo 2 dimensiones. En vez de representar el espacio 25-dimensional completo continuo, SOM proporciona los puntos 'más importantes' en ese espacio.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X