Es posible que desees leer la explicación detallada de Dinno sobre la aplicación de la Análisis Paralelo de Horn al Análisis de Componentes Principales versus Análisis Factorial. Aquí tienes una breve síntesis:
El análisis de componentes principales (PCA) implica la descomposición de la matriz de correlación R (o menos comúnmente, la matriz de covarianza Σ), para obtener los autovectores (los cuales son generalmente en lo que se basa la interpretación sustantiva de PCA), y los autovalores, Λ (en los cuales se basan decisiones empíricas de retención, como el análisis paralelo).
El análisis factorial común (FA) implica la descomposición de la matriz de correlación R con los elementos diagonales reemplazados por las comunalidades: C=R−diag(R+)+, donde R+ indica la inversa generalizada (también conocida como inversa de Moore-Penrose, o pseudo-inversa) de la matriz R, para obtener también autovectores (los cuales también son generalmente en lo que se basa la interpretación sustantiva de FA), y autovalores, Λ (que al igual que en PCA, son en lo que se basan decisiones empíricas de retención, como el análisis paralelo).
Los autovalores, Λ={λ1,…,λp} (p es igual al número de variables que producen R) se ordenan de mayor a menor, y en un PCA basado en R se interpretan como distribuyendo p unidades de varianza total bajo el supuesto de que cada variable observada contribuye 1 unidad a la varianza total. Cuando PCA está basado en Σ, entonces cada autovalor, λ, se interpreta como asignando trace(Σ) unidades de varianza total bajo el supuesto de que cada variable contribuye con la magnitud de su varianza a la varianza total. En FA, los autovalores se interpretan como asignando <p unidades de varianza común; esta interpretación es problemática porque los autovalores en FA pueden ser negativos y es difícil saber cómo interpretar esos valores tanto en términos de asignación, como en términos de varianza.
El procedimiento de análisis paralelo implica:
- Obtener {λ1,…,λp} para los datos observados, X.
- Obtener {λr1,…,λrp} para datos no correlacionados (aleatorios) del mismo n y p que X.
- Repetir el paso 2 muchas veces, digamos k veces.
- Calcular el promedio de cada autovalor del paso 3 sobre k para producir {¯λr1,…,¯λrp}.
- Retener aquellos q componentes o factores comunes donde λq>¯λrq
El análisis paralelo de Monte Carlo emplea un centil alto (por ejemplo, el 95vo) en lugar de la media en el paso 4.
1 votos
Posible duplicado de ¿Cuáles son las diferencias entre Análisis de Factores y Análisis de Componentes Principales
0 votos
Aquí parece que hay una pregunta que no está respondida en el duplicado, @rolando2: FA "gira" los componentes principales, y por tanto debería (por derecho) producir exactamente tantos "factores" como "componentes". Este método de "análisis paralelo" (con el que no estoy familiarizado) parece seleccionar de alguna manera un número diferente de "factores".