La situación es la siguiente. Hay 400 ejemplos en el conjunto de entrenamiento y 200 clases discretas (cada clase tiene dos ejemplos). Hay unos cuantos miles de atributos.
Cuando ejecute la reducción de la dimensionalidad a 2D o 3D, me gustaría ver (de forma óptima) 200 clusters de 2 puntos cada uno - un cluster para cada clase. Sin embargo, en la práctica no es así.
La cuestión es cómo elegir el conjunto de atributos que dará resultados óptimos con la agrupación/clasificación (ya sea con reducción de la dimensionalidad o sin ella).