7 votos

La Variable de ordenamiento de uso de PCA

He descargado una secuencia de comandos para dibujar una matriz de correlación mediante círculos de colores. Este script permite ordenar las variables de uso de PCA, pero no estoy seguro de cómo funciona. El código responsable de ordenar es el siguiente:

if (order) {
    if(!n==m){
            stop("The matrix must be squre if order is TRUE!")
    }
  x.eigen <- eigen(corr)$vectors[, 1:2]
  e1 <- x.eigen[, 1]
  e2 <- x.eigen[, 2]
  alpha <- ifelse(e1 > 0, atan(e2/e1), atan(e2/e1) + pi)
  corr <- corr[order(alpha), order(alpha)]
}

Pregunta: ¿Cuál es la interpretación de tales pedidos y lo que la teoría que hay detrás de ella?

9voto

Judioo Puntos 625

Se describe en Michael Amistoso del Estadístico Americano papel en corrgrams, Preprint PDF aquí. Véase la sección sobre la correlación de pedidos. También si usted mira en la fuente de la corrgram biblioteca podrás ver algunas otras maneras posibles de ordenar los datos.

Para describir lo que hace el código en una cáscara de nuez, las variables en la matriz de correlación están ordenados de acuerdo a las correlaciones con el primer y el segundo principio de los componentes extraídos de la misma matriz de correlación. Si usted mira el vector propio de la parcela en el Amistoso de papel (Figura 3), el código atan(e2/e1) es el ángulo entre el rayo asociados con una determinada variable y en el eje horizontal. Las variables se clasifican por este ángulo, en sentido contrario de la orden. Si toda la imagen se apretó horizontalmente por la raíz cuadrada del primer autovalor, y verticalmente por la raíz cuadrada del segundo autovalor (esto no cambiaría el orden!), a continuación, el xx yy coordenadas de cada uno de los rayos del extremo sería exactamente la correlación de esta variable con la RP1 y con la PC2.

Figure 3 from Friendly

De nuevo la razón de la orden es dada en el Amistoso de papel, pero casi siempre quieren más cosas similares junto a más cosas similares (en cualquiera de los gráficos o tablas). Con frecuencia el orden es más informativo que los números o el gráfico! Aquí, en este ejemplo "más parecido" se define en términos de correlaciones para el primer y el segundo principio de componentes.

Tenga en cuenta también supongo que la primera instrucción if en el código impide que el orden en que se produzca si la matriz de correlación no es de rango completo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X