Creo que hay diferentes opiniones o puntos de vista acerca de la PCA, pero, básicamente, a menudo pensamos en él como una técnica de reducción (reducir sus características de espacio para uno más pequeño, a menudo mucho más "legible" proporciona cuidar adecuadamente de centrado/a la estandarización de los datos cuando es necesario) o un camino para la construcción de factores latentes o dimensiones que dan cuenta de una parte significativa de la inter-individuales de dispersión (aquí, las "personas" a las unidades estadísticas en el que se recopilan datos; este puede ser el país, la gente, etc.). En ambos casos, se construye combinaciones lineales de las variables originales que cuenta para el máximo de la varianza (cuando se proyecta sobre el eje principal), sujeto a una restricción de ortogonalidad entre dos componentes principales. Ahora, lo que se ha descrito es puramente algebrical o matemática y no pensamos en ello como un (generar) modelo, contrario a lo que se hace en el análisis del factor de tradición, donde se incluye un término de error para dar cuenta de algún tipo de error en la medición. También me gusta la introducción dada por William Revelle en su próxima manual de psicometría aplicada con R (Capítulo 6), si queremos analizar la estructura de una matriz de correlación, entonces
El primer enfoque, PCA] es un modelo de
que se aproxima a la correlación
la matriz en términos del producto de
componentes donde cada componente es un
ponderado de la suma lineal de las variables,
el segundo modelo [factor de análisis]
también una aproximación de la
matriz de correlación por el producto de la
dos factores, pero los factores que en este
son vistos como causas en lugar de como
consecuencias de las variables.
En otras palabras, con la PCA está expresando cada componente (factor) como una combinación lineal de las variables, mientras que en la FA estas son las variables que se expresan como una combinación lineal de los factores. Es bien reconocido que ambos métodos se suelen generar bastante similares resultados (ver, por ejemplo, Harman, 1976 o Catell, 1978), especialmente en el "ideal" caso donde tenemos un gran número de individuos y un buen factor de relación:las variables (normalmente oscila entre 2 y 10 dependiendo de los autores considera usted!). Esto es debido a que, mediante la estimación de las diagonales en la matriz de correlación (como se hace en el FA, y estos elementos son conocidos como los communalities), la varianza de error es eliminado por el factor de la matriz. Esta es la razón por la que el PCA se utiliza a menudo como una manera de descubrir los factores latentes o constructos psicológicos en lugar de FA desarrollado en el último siglo. Pero, como vamos por este camino, con frecuencia se desea llegar a una más fácil interpretación de la resultante del factor de estructura (o el llamado patrón de la matriz). Y luego viene el truco útil de rotación del eje factorial para maximizar saturaciones de las variables en el factor específico, o, equivalentemente, llegar a una "estructura simple". El uso de rotación ortogonal (VARIMAX por ejemplo,), podemos preservar la independencia de los factores. Con rotación oblicua (por ejemplo, OBLIMIN, PROMAX), lo rompen y los factores que se permite correlacionar. Esto ha sido ampliamente debatido en la literatura, y ha llevado a algunos autores (no psychometricians, pero los estadísticos en la década de los años 1960) a la conclusión de que la FA es un injusto enfoque debido al hecho de que los investigadores pueden buscar el factor de la solución que es la más conveniente para interpretar.
Pero el punto es que la rotación de los métodos fueron desarrollados originalmente en el contexto de la FA enfoque y ahora se utilizan habitualmente con PCA. No creo que esto se contradice con los algoritmos de cálculo de los componentes principales: Se puede girar el factorial de ejes de la manera que usted desee, siempre que usted tenga en mente que una vez correlacionados (por rotación oblicua) la interpretación de la factorial espacio se vuelve menos evidente.
PCA se utiliza de forma rutinaria en el desarrollo de nuevos cuestionarios, a pesar de FA es probablemente un mejor enfoque en este caso, porque estamos tratando de extraer factores significativos que tomar en cuenta los errores de medición y cuyas relaciones podrían ser estudiadas por su propia cuenta (por ejemplo, teniendo el patrón resultante de la matriz, se obtiene un segundo factor de modelo). Pero PCA también se utiliza para comprobar la estructura factorial de la ya validadas. Los investigadores no importa realmente acerca de FA vs PCA cuando ellos tienen, es decir 500 representante de los sujetos a los que se pide a una tasa de 60-cuestionario de abordar cinco dmensions (este es el caso de la NEO-FFI, por ejemplo), y yo creo que tienen razón, porque en este caso no estamos muy interesados en la identificación de una generación o el modelo conceptual (el término "representante" se utiliza aquí para aliviar el problema de la invarianza de medición).
Ahora, sobre la elección del método de rotación y por qué algunos autores argumentan en contra del uso estricto de la rotación ortogonal, me gustaría citar a Pablo Kline, como lo hice en respuesta a la siguiente pregunta, FA: la Elección de la Rotación de la matriz, basada en la "Estructura Simple Criterios",
(...) en el mundo real, no es
descabellado pensar que factores, como
importantes determinantes de la conducta,
sería correlacionados. -- P. Kline,
De inteligencia. El Psicométricas de la Vista, 1991, pág. 19
Yo tendría, por tanto, a la conclusión de que, dependiendo del objetivo de su estudio (¿desea resaltar los principales patrones de la matriz de correlación o hacer que procuran proporcionar una interpretación sensata de los mecanismos subyacentes que pueden haber causado a observar una matriz de correlación), para elegir el método que es el más apropiado: Esto no tiene que ver con la construcción de combinaciones lineales, sino simplemente en la forma en que desea interpretar el resultado factorial espacio.
Referencias
- Harman, H. H. (1976). Moderno Factor De Análisis. Chicago, University of Chicago Press.
- Cattell, R. B. (1978). El Uso Científico del Análisis factorial. Nueva York, Plenum.
- Kline, P. (1991). De inteligencia. El Psicométricas De La Vista. Routledge.