1 votos

Obtenga los valores propios cuando conozca las varianzas explicadas de un gráfico PCA

Estoy realizando un PCA utilizando el sklearn.decomposition.pca función.

Parece que funciona como debería. Según esto pregunta Puedo obtener los valores propios así:.

Los valores propios representan la varianza en la dirección del vector propio. Así que puede obtenerlos a través del atributo pca.explained_variance_:

eigenvalues = pca.explained_variance_

Si esto es correcto, los valores propios de mis primeros componentes parecen ser demasiado altos.

eigenvalues = pca.explained_variance_
eigenvalues # returns  [1188.482427    760.26572144  581.29434167  325.56710676  267.10095401
  219.49301802  155.1603308   107.8855256    76.17770897   64.09568959]

En todos los screeplot que he visto y, por ejemplo, cuando buscas en google screeplot, los valores propios suelen ser mucho, mucho más bajos. ¿Pueden los valores propios ser tan altos?

2voto

Vitaly Zdanevich Puntos 95

sklearn no escala sus datos:

Los datos de entrada se centran pero no se escalan para cada característica antes de aplicar la SVD.

Sus desviaciones son altas porque sus desviaciones de características son altas. En general, se recomienda la normalización porque, de lo contrario, algunas de sus características con valores bajos no estarán bien representadas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X