Tal vez desee leer el libro de Dinno Aclaración de la aplicación del análisis paralelo de Horn al análisis de componentes principales frente al análisis factorial . He aquí una breve destilación:
El análisis de componentes principales (ACP) consiste en la descomposición propia de la matriz de correlación $\mathbf{R}$ (o menos comúnmente, la matriz de covarianza $\mathbf{\Sigma}$ ), para dar los vectores propios (que son generalmente lo que la interpretación sustantiva de PCA se trata), y los valores propios, $\mathbf{\Lambda}$ (que es en lo que se basan las decisiones empíricas de retención, como el análisis paralelo).
El análisis factorial común (AF) consiste en la descomposición propia de la matriz de correlación $\mathbf{R}$ con los elementos diagonales sustituidos por el comunalidades : $\mathbf{C} = \mathbf{R} - \text{diag}(\mathbf{R}^{+})^{+}$ , donde $\mathbf{R}^{+}$ indica el inversa generalizada (alias Inversa de Moore-Penrose ou pseudoinverso ) de la matriz $\mathbf{R}$ para dar también los vectores propios (que son también, en general, lo que la interpretación sustantiva de FA), y los valores propios, $\mathbf{\Lambda}$ (que, como en el caso del ACP, son en los que se basan las decisiones de retención empírica, como el análisis paralelo).
Los valores propios, $\mathbf{\Lambda} = \{\lambda_{1}, \dots, \lambda_{p}\}$ ( $p$ es igual al número de variables que producen $\mathbf{R}$ ) se ordenan de mayor a menor, y en un ACP basado en $\mathbf{R}$ se interpretan como el reparto de $p$ unidades de varianza total bajo el supuesto de que cada variable observada contribuye con 1 unidad a la varianza total. Cuando el ACP se basa en $\mathbf{\Sigma}$ y luego cada valor propio, $\lambda$ se interpreta como el reparto de $\text{trace}(\mathbf{\Sigma})$ unidades de varianza total bajo el supuesto de que cada variable contribuye con la magnitud de su varianza a la varianza total. En el AF, los valores propios se interpretan como un reparto de $< p$ unidades de variante común Esta interpretación es problemática, ya que los valores propios en FA pueden ser negativos y es difícil saber cómo interpretar dichos valores, tanto en términos de reparto como de varianza.
El procedimiento de análisis paralelo implica:
- Obtención de $\{\lambda_{1}, \dots, \lambda_{p}\}$ para los datos observados, $\mathbf{X}$ .
- Obtención de $\{\lambda^{r}_{1}, \dots, \lambda^{r}_{p}\}$ para datos no correlacionados (aleatorios) del mismo $n$ et $p$ como $\mathbf{X}$ .
- Repitiendo el paso 2 muchas veces, digamos $k$ número de veces.
- Promediando cada valor propio del paso 3 sobre $k$ para producir $\{\overline{\lambda}^{r}_{1}, \dots, \overline{\lambda}^{r}_{p}\}$ .
- Retención de los $q$ componentes o factores comunes donde $\lambda_{q} > \overline{\lambda}^{r}_{q}$
El análisis paralelo de Monte Carlo emplea un centil alto (por ejemplo, el 95 $^{\text{th}}$ ) en lugar de la media en el paso 4.
1 votos
Posible duplicado de ¿Cuáles son las diferencias entre el análisis factorial y el análisis de componentes principales?
0 votos
Parece que aquí hay una pregunta que no se responde en el duplicado, @rolando2: FA "rota" los componentes principales, por lo que debería (por derecho) producir exactamente tantos "factores" como "componentes". Este método de "análisis paralelo" (con el que no estoy familiarizado) parece seleccionar de alguna manera un número diferente de "factores".