Dado un conjunto de $n$ de los casos. Para cada caso, tengo una función vectorial consta de $m$ (numérica) características ($x_1$, $x_2$,...,$x_m$), n>>m. Por otra parte, para cada instancia, tengo un puntaje numérico $y$ (observable). Me gustaría:
- encontrar el subconjunto de características o combinación lineal de los mismos, explica las puntuaciones de los mejores.
- crear una buena visualización para esto.
Me han apuntado a un Análisis de Componentes Principales (PCA). El problema con la PCA es que sólo se necesita la función de los vectores en cuenta; PCA no se relacionan las características de la puntuación numérica $y$.
Aplicación práctica: Dado un número grande de problema instancias (por ejemplo, problemas del viajante) y algún algoritmo para resolver el problema. Cada vez que se resuelve el ejemplo, podemos medir el tiempo total (puntuación=) se llevó a resolver el ejemplo. Por otra parte, para cada instancia, podemos obtener una serie de características, por ejemplo, el tamaño de la te, por ejemplo, el gráfico de diámetro, etc. Cuáles de estas características explican el tiempo de cómputo de la mejor manera?