0 votos

Selección de características para la muestra 2D

Tengo un conjunto de datos en el que cada muestra tiene datos matriciales 2D, por ejemplo, una matriz de tamaño 50x1000. Cada una de estas 50 filas tiene significados diferentes. Convierto esto en datos de tamaño 1*50.000 y utilizo svm para la clasificación. Pero ahora quiero averiguar las filas más significativas para la clasificación. He comprobado Sequential Feature Selection de matlab, pero el problema es que descarta y toma algunas columnas de la fila 1, algunas columnas de la fila 2, etc. Pero yo quiero usar cada fila como un grupo para la selección de características, de forma que o tomo esa fila entera o no. ¿Alguien conoce algún algoritmo para este fin?

1voto

M_1 Puntos 313

Utilice el ACP para reducir las 50 dimensiones a, por ejemplo, 3 ó 4 dimensiones (o el número de PC cuyos valores propios sean > 1). La información de las 50 dimensiones permanecerá en el conjunto de dimensiones más pequeñas y, de este modo, no utilizará características diferentes del conjunto de 50 para cada muestra. La reducción de dimensión PCA empleará un uso justo de toda la información del conjunto original. Además, yo apilaría todas las muestras una encima de otra (miles de filas con 50 columnas) y ejecutaría PCA en la matriz de correlación de las 50 columnas. No divida las muestras y ejecute PCA en cada muestra (matriz de 50x1000) por separado.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X