2 votos

Elección de atributos para la agrupación/clasificación

La situación es la siguiente. Hay 400 ejemplos en el conjunto de entrenamiento y 200 clases discretas (cada clase tiene dos ejemplos). Hay unos cuantos miles de atributos.

Cuando ejecute la reducción de la dimensionalidad a 2D o 3D, me gustaría ver (de forma óptima) 200 clusters de 2 puntos cada uno - un cluster para cada clase. Sin embargo, en la práctica no es así.

La cuestión es cómo elegir el conjunto de atributos que dará resultados óptimos con la agrupación/clasificación (ya sea con reducción de la dimensionalidad o sin ella).

1voto

Amadiere Puntos 5606

Aunque se vieran "grupos" de 2 puntos cada uno, no sería estadísticamente significativo. Se necesitan más datos. Dos ejemplos por clase es demasiado poco.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X