Algunos trabajos científicos informan de resultados de análisis paralelos de análisis de factores de eje principal de una manera incompatible con mi comprensión de la metodología. ¿Qué me estoy perdiendo? ¿Estoy equivocado o ellos.
Ejemplo:
- Data: Se ha observado el rendimiento de 200 humanos individuales en 10 tareas. Para cada individuo y cada tarea, uno tiene una puntuación de rendimiento. La cuestión ahora es determinar cuántos factores son la causa del rendimiento en las 10 tareas.
- Método: análisis paralelo para determinar el número de factores a retener en un análisis de factores de eje principal.
- Ejemplo de resultado comunicado: "El análisis paralelo sugiere que sólo deben conservarse los factores con un valor propio de 2,21 o más".
Eso es una tontería, ¿no?
A partir del documento original de Horn (1965) y de tutoriales como Hayton y otros (2004) entiendo que el análisis paralelo es una adaptación del criterio de Kaiser (valor propio > 1) basado en datos aleatorios. Sin embargo, la adaptación no consiste en sustituir el valor de corte 1 por otro número fijo, sino un valor de corte individual para cada factor (y dependiente del tamaño del conjunto de datos, es decir, 200 veces 10 puntuaciones). Si se observan los ejemplos de Horn (1965) y Hayton y otros (2004) y el resultado de las funciones R fa.paralelo en el psicológico paquete y paralelo en el nFactores veo que el análisis paralelo produce una curva de pendiente descendente en el gráfico de Scree para compararla con los valores propios de los datos reales. Más bien "Retener el primer factor si su valor propio es > 2,21; adicionalmente retener el segundo si su valor propio es > 1,65; ".
¿Existe algún entorno sensato, alguna escuela de pensamiento o alguna metodología que haga que "el análisis paralelo sugiere que sólo los factores con un valor propio de 2,21 o más deben ser retenidos" sean correctos?
Referencias:
Hayton, J.C., Allen, D.G., Scarpello, V. (2004). Factor retention decisions in exploratory factor analysis: a tutorial on parallel analysis. Organizational Research Methods, 7(2):191-205.
Horn, J.L. (1965). Una justificación y prueba del número de factores en el análisis de factores. Psychometrika, 30(2):179-185.
1 votos
Por cierto, el requisito de Hayton et al. de que la forma de distribución de los datos no correlacionados utilizados para generar valores propios medios para estimar el "sesgo de muestreo" fue examinado críticamente y rechazado en Dinno, A. (2009). Exploring the Sensitivity of Horn's Parallel Analysis to the Distributional Form of Simulated Data. Investigación conductual multivariante , 44(3):362-388.
1 votos
También, por cierto, ver mi paquete de análisis paralelo
paran
para R (en CRAN) y para Stata (dentro de Stata tipo findit paran).