Processing math: 100%

5 votos

¿Cuál es la diferencia entre un componente y un factor en el análisis paralelo?

El paquete psych en R tiene una función fa.parallel para ayudar a determinar el número de factores o componentes. Según la documentación:

Una forma de determinar el número de factores o componentes en una matriz de datos o una matriz de correlación es examinar el gráfico de "scree" de los autovalores sucesivos. Roturas bruscas en el gráfico sugieren el número apropiado de componentes o factores a extraer. El análisis "paralelo" es una técnica alternativa que compara el gráfico de factores de los datos observados con el de una matriz de datos aleatoria del mismo tamaño que el original. fa.parallel.poly hace esto para análisis tetracóricos o policóricos.

Cuando ejecuto la función obtengo la siguiente salida:

El análisis paralelo sugiere que el número de factores =  7  
                            y el número de componentes =  4

¿Cuál es la diferencia entre un factor y un componente?

0 votos

Aquí parece que hay una pregunta que no está respondida en el duplicado, @rolando2: FA "gira" los componentes principales, y por tanto debería (por derecho) producir exactamente tantos "factores" como "componentes". Este método de "análisis paralelo" (con el que no estoy familiarizado) parece seleccionar de alguna manera un número diferente de "factores".

4voto

GenericTypeTea Puntos 27689

Es posible que desees leer la explicación detallada de Dinno sobre la aplicación de la Análisis Paralelo de Horn al Análisis de Componentes Principales versus Análisis Factorial. Aquí tienes una breve síntesis:

El análisis de componentes principales (PCA) implica la descomposición de la matriz de correlación R (o menos comúnmente, la matriz de covarianza Σ), para obtener los autovectores (los cuales son generalmente en lo que se basa la interpretación sustantiva de PCA), y los autovalores, Λ (en los cuales se basan decisiones empíricas de retención, como el análisis paralelo).

El análisis factorial común (FA) implica la descomposición de la matriz de correlación R con los elementos diagonales reemplazados por las comunalidades: C=Rdiag(R+)+, donde R+ indica la inversa generalizada (también conocida como inversa de Moore-Penrose, o pseudo-inversa) de la matriz R, para obtener también autovectores (los cuales también son generalmente en lo que se basa la interpretación sustantiva de FA), y autovalores, Λ (que al igual que en PCA, son en lo que se basan decisiones empíricas de retención, como el análisis paralelo).

Los autovalores, Λ={λ1,,λp} (p es igual al número de variables que producen R) se ordenan de mayor a menor, y en un PCA basado en R se interpretan como distribuyendo p unidades de varianza total bajo el supuesto de que cada variable observada contribuye 1 unidad a la varianza total. Cuando PCA está basado en Σ, entonces cada autovalor, λ, se interpreta como asignando trace(Σ) unidades de varianza total bajo el supuesto de que cada variable contribuye con la magnitud de su varianza a la varianza total. En FA, los autovalores se interpretan como asignando <p unidades de varianza común; esta interpretación es problemática porque los autovalores en FA pueden ser negativos y es difícil saber cómo interpretar esos valores tanto en términos de asignación, como en términos de varianza.

El procedimiento de análisis paralelo implica:

  1. Obtener {λ1,,λp} para los datos observados, X.
  2. Obtener {λr1,,λrp} para datos no correlacionados (aleatorios) del mismo n y p que X.
  3. Repetir el paso 2 muchas veces, digamos k veces.
  4. Calcular el promedio de cada autovalor del paso 3 sobre k para producir {¯λr1,,¯λrp}.
  5. Retener aquellos q componentes o factores comunes donde λq>¯λrq

El análisis paralelo de Monte Carlo emplea un centil alto (por ejemplo, el 95vo) en lugar de la media en el paso 4.

1 votos

Hace mucho tiempo di un voto positivo a esta respuesta (+1), pero me gustaría señalar que el procedimiento de análisis factorial utilizado por el paquete psych no es el que se describe en esta respuesta. Hay varios métodos comunes de extracción de factores (y psych implementa varios de ellos), pero que yo sepa, ninguno de ellos se reduce a una matriz de autovalores de C=Rdiag(R+)+ como parece implicar esta respuesta.

0 votos

@amoeba Gorsuch, R. L. (1983). Análisis de factores 2ª ed. NJ: Lawrence Erlbaum Associates. Por supuesto, hay otras formas de estimar las comunidades (por ejemplo, factores iterados, etc.). Stata, por ejemplo, calcula los "factores principales" predeterminados utilizando las matemáticas que he descrito.

0 votos

Tengo una copia electrónica de la primera edición de este libro. ¿Me podrías referir a una sección específica por favor? En cualquier caso, consulté el manual del paquete psych y estoy bastante seguro de que el método que describes (aunque exista en la literatura) no está implementado allí.

3voto

Ankur Loriya Puntos 160

Se trata de componentes principales. Primero, encuentra los autovalores de la matriz de correlación que toma como entrada. Luego decide cuántos de esos valores son "razonablemente grandes" haciendo simulaciones y comparándolos con los valores simulados. Aquí está la parte clave del código:

valuesx <- eigen(rx)$values

y luego más adelante:

pc.test <- which(!(valuesx > values.sim$mean))[1] - 1
        results$nfact <- fa.test
    results$ncomp <- pc.test
    cat("El análisis paralelo sugiere que ")
    cat("el número de factores = ", fa.test, " y el número de componentes = ", 
        pc.test, "\n")

La función completa está escrita en R, por lo que puedes leer su código fuente escribiendo su nombre en la terminal de R.

Aquí tienes una presentación que compara el análisis factorial con el PCA y que espero responda tu pregunta (mira la última diapositiva en particular):

http://www.stats.ox.ac.uk/~ripley/MultAnal_HT2007/PC-FA.pdf

1 votos

Entonces, si entiendo tu respuesta, un factor es un resultado del análisis de factores. ¿Un componente es simplemente un resultado del análisis de componentes principales?

1 votos

Sí. Creo que el paquete está utilizando "componente" como abreviatura de "componente principal" en la salida que has citado.

1voto

Scott Puntos 1494

Actualmente hay dos líneas, una para el procedimiento de pca y la otra para el procedimiento de minres (predeterminado) a menos que se seleccione otro. El programa utiliza los fa$values y los eigenvalores fa$e.values. Los fa$values son los valores de la solución de factor común. Los fa$values son menores que los eigenvalores.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X