5 votos

Realice la PCA. Extraer las PC. ¿Se puede saber entonces cuáles eran las características _originales_ más importantes a partir de las PC?

Supongamos que tenemos 1.000 características y un conjunto de datos formado por, digamos, 50.000 puntos. Supongamos entonces que realizamos el ACP y extraemos los 5 mejores PC, ya que explican el 99,99% de la varianza, y eso es todo lo que nos importa.

A partir de esos 5 primeros ordenadores, ¿podemos "retroceder" y ser capaces de descifrar cuáles eran las características más "importantes" de los 1000 originales? Por ejemplo, ¿podemos responder a la pregunta: "¿Qué combinación de mis 1000 características originales fue la responsable de mi mejor PC?"

Gracias.

5voto

karatchov Puntos 230

Cada uno de los componentes principales proyecta todo el espacio de características originales en varias dimensiones, que llamaré características latentes. Cuanto más contribuye una característica original a una característica latente, más importante es para esa característica.

Por lo tanto, observe los valores absolutos de los componentes de los vectores propios correspondientes al $k$ mayores valores propios. Cuanto más grandes son, más contribuye una característica específica a ese componente principal.

Sin embargo, hay que tener en cuenta que suelen ser densos. Si quieres encontrar algún tipo de espacio de características mínimo que explique la mayor parte de los datos, puede que te interese el pca disperso.

2voto

Zizzencs Puntos 1358

Puede responder a la última pregunta mirando las cargas de ese PC. También podría hacerlo para cada uno de los otros 5 PC. No estoy seguro de lo que podría hacer con el en general importancia de determinadas variables.

1voto

user31180 Puntos 21

Dado que los vectores propios provienen de la combinación lineal de las variables originales, no creo que se pueda determinar con seguridad cuáles son las variables originales que se pueden eliminar del PCA. Creo que esto es más bien una pregunta de Análisis Factorial (relacionada con las variables latentes).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X