23 votos

Cómo blanquear los datos mediante análisis de componentes principales?

Quiero transformar los datos de mi $\mathbf X$ de manera tal que las varianzas será uno y el covarianzas será cero (i.e quiero blanquear los datos). Además, el medio debe ser igual a cero.

Sé que voy a llegar allí haciendo Z-normalización y PCA-transformación, pero en que orden debo hacer?

Debo añadir que el compuesto de blanqueamiento de transformación debe tener la forma $\mathbf{x} \mapsto W\mathbf{x} + \mathbf{b}$.

Hay un método similar al de la PCA, que hace exactamente tanto estas transformaciones y me da una fórmula de la forma anterior?

41voto

zowens Puntos 1417

En primer lugar, obtiene la media de cero restando la media de $\boldsymbol \mu = \frac{1}{N}\sum \mathbf{x}$.

En segundo lugar, obtener la covarianzas cero haciendo PCA. Si $\boldsymbol \Sigma$ es la matriz de covarianza de los datos, luego de la PCA, equivale a realizar un eigendecomposition $\boldsymbol \Sigma = \mathbf{U} \boldsymbol \Lambda \mathbf{U}^\top$ donde $\mathbf{U}$ es una rotación ortogonal de la matriz compuesta de vectores propios de a $\boldsymbol \Sigma$, e $\boldsymbol \Lambda$ es una matriz diagonal con los valores propios de la diagonal. Matriz $\mathbf{U}^\top$ da un giro necesario para de-correlacionar los datos (es decir, los mapas de las características originales de componentes principales).

Tercero, después de la rotación de cada componente tendrá la varianza dada por una correspondiente autovalor. Así que, para la igualdad de varianzas a $1$, es necesario dividir por la raíz cuadrada de $\boldsymbol \Lambda$.

Todos juntos, blanqueamiento de la transformación es $\mathbf{x} \mapsto \boldsymbol \Lambda^{-1/2} \mathbf{U}^\top (\mathbf{x} - \boldsymbol \mu)$. Puede abrir el paréntesis para obtener el formulario que usted está buscando.


La actualización. Ver también esta tarde hilo para más detalles: ¿Cuál es la diferencia entre la ZCA de blanqueamiento y la PCA de blanqueamiento?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X