1 votos

¿Conserva el PCA las observaciones (filas) de los datos?

Digamos que tengo una matriz de datos de tamaño $N \times P$ donde $N$ es el número de muestras y $P$ es el número de características. Ahora, si hago el análisis de componentes principales, obtengo otra matriz de datos de tamaño $N \times K$ donde $K$ se eligió según algunos criterios. Mi pregunta: si elijo una fila (muestra) del $\text{PCA}$ matriz, ¿sigue apuntando a la mismo muestra como en la matriz de datos original?

En mi estudio los datos de cada fila son de un sujeto, por lo que quiero saber si la correspondencia sigue existiendo si uso $\text{PCA}$ para la selección de características. (Creo que esto es correcto, pero más vale prevenir que curar...)

2voto

ssn Puntos 472

Como han dicho otros en los comentarios, sí, conserva el orden de las filas. Si tienes una matriz de datos estandarizada $\mathbf D$ y una matriz de rotación $\mathbf \Omega$ , se obtienen las muestras rotadas $\mathbf R$ simplemente haciendo:

$$\mathbf D \mathbf \Omega = \mathbf R$$

Como puede ver, mediante la multiplicación de la matriz se conserva el orden de las filas.

$\mathbf \Omega$ es una matriz cuadrada con $P$ filas y columnas. Si quieres reducir el número de PCs todo lo que tienes que hacer es mantener sólo la primera $K$ columnas de $\mathbf \Omega$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X