11 votos

Sobre el uso de la rotación oblicua después de la PCA

Varios paquetes estadísticos, tales como SAS, SPSS, y R, que le permiten llevar a cabo algún tipo de factor de rotación después de un PCA.

  1. ¿Por qué es una rotación necesario después de un PCA?
  2. ¿Por qué habría de aplicar una rotación oblicua después de un PCA dado que el objetivo de la PCA es producir dimensiones ortogonales?

9voto

DavLink Puntos 101

Creo que hay diferentes opiniones o puntos de vista acerca de la PCA, pero, básicamente, a menudo pensamos en él como una técnica de reducción (reducir sus características de espacio para uno más pequeño, a menudo mucho más "legible" proporciona cuidar adecuadamente de centrado/a la estandarización de los datos cuando es necesario) o un camino para la construcción de factores latentes o dimensiones que dan cuenta de una parte significativa de la inter-individuales de dispersión (aquí, las "personas" a las unidades estadísticas en el que se recopilan datos; este puede ser el país, la gente, etc.). En ambos casos, se construye combinaciones lineales de las variables originales que cuenta para el máximo de la varianza (cuando se proyecta sobre el eje principal), sujeto a una restricción de ortogonalidad entre dos componentes principales. Ahora, lo que se ha descrito es puramente algebrical o matemática y no pensamos en ello como un (generar) modelo, contrario a lo que se hace en el análisis del factor de tradición, donde se incluye un término de error para dar cuenta de algún tipo de error en la medición. También me gusta la introducción dada por William Revelle en su próxima manual de psicometría aplicada con R (Capítulo 6), si queremos analizar la estructura de una matriz de correlación, entonces

El primer enfoque, PCA] es un modelo de que se aproxima a la correlación la matriz en términos del producto de componentes donde cada componente es un ponderado de la suma lineal de las variables, el segundo modelo [factor de análisis] también una aproximación de la matriz de correlación por el producto de la dos factores, pero los factores que en este son vistos como causas en lugar de como consecuencias de las variables.

En otras palabras, con la PCA está expresando cada componente (factor) como una combinación lineal de las variables, mientras que en la FA estas son las variables que se expresan como una combinación lineal de los factores. Es bien reconocido que ambos métodos se suelen generar bastante similares resultados (ver, por ejemplo, Harman, 1976 o Catell, 1978), especialmente en el "ideal" caso donde tenemos un gran número de individuos y un buen factor de relación:las variables (normalmente oscila entre 2 y 10 dependiendo de los autores considera usted!). Esto es debido a que, mediante la estimación de las diagonales en la matriz de correlación (como se hace en el FA, y estos elementos son conocidos como los communalities), la varianza de error es eliminado por el factor de la matriz. Esta es la razón por la que el PCA se utiliza a menudo como una manera de descubrir los factores latentes o constructos psicológicos en lugar de FA desarrollado en el último siglo. Pero, como vamos por este camino, con frecuencia se desea llegar a una más fácil interpretación de la resultante del factor de estructura (o el llamado patrón de la matriz). Y luego viene el truco útil de rotación del eje factorial para maximizar saturaciones de las variables en el factor específico, o, equivalentemente, llegar a una "estructura simple". El uso de rotación ortogonal (VARIMAX por ejemplo,), podemos preservar la independencia de los factores. Con rotación oblicua (por ejemplo, OBLIMIN, PROMAX), lo rompen y los factores que se permite correlacionar. Esto ha sido ampliamente debatido en la literatura, y ha llevado a algunos autores (no psychometricians, pero los estadísticos en la década de los años 1960) a la conclusión de que la FA es un injusto enfoque debido al hecho de que los investigadores pueden buscar el factor de la solución que es la más conveniente para interpretar.

Pero el punto es que la rotación de los métodos fueron desarrollados originalmente en el contexto de la FA enfoque y ahora se utilizan habitualmente con PCA. No creo que esto se contradice con los algoritmos de cálculo de los componentes principales: Se puede girar el factorial de ejes de la manera que usted desee, siempre que usted tenga en mente que una vez correlacionados (por rotación oblicua) la interpretación de la factorial espacio se vuelve menos evidente.

PCA se utiliza de forma rutinaria en el desarrollo de nuevos cuestionarios, a pesar de FA es probablemente un mejor enfoque en este caso, porque estamos tratando de extraer factores significativos que tomar en cuenta los errores de medición y cuyas relaciones podrían ser estudiadas por su propia cuenta (por ejemplo, teniendo el patrón resultante de la matriz, se obtiene un segundo factor de modelo). Pero PCA también se utiliza para comprobar la estructura factorial de la ya validadas. Los investigadores no importa realmente acerca de FA vs PCA cuando ellos tienen, es decir 500 representante de los sujetos a los que se pide a una tasa de 60-cuestionario de abordar cinco dmensions (este es el caso de la NEO-FFI, por ejemplo), y yo creo que tienen razón, porque en este caso no estamos muy interesados en la identificación de una generación o el modelo conceptual (el término "representante" se utiliza aquí para aliviar el problema de la invarianza de medición).

Ahora, sobre la elección del método de rotación y por qué algunos autores argumentan en contra del uso estricto de la rotación ortogonal, me gustaría citar a Pablo Kline, como lo hice en respuesta a la siguiente pregunta, FA: la Elección de la Rotación de la matriz, basada en la "Estructura Simple Criterios",

(...) en el mundo real, no es descabellado pensar que factores, como importantes determinantes de la conducta, sería correlacionados. -- P. Kline, De inteligencia. El Psicométricas de la Vista, 1991, pág. 19

Yo tendría, por tanto, a la conclusión de que, dependiendo del objetivo de su estudio (¿desea resaltar los principales patrones de la matriz de correlación o hacer que procuran proporcionar una interpretación sensata de los mecanismos subyacentes que pueden haber causado a observar una matriz de correlación), para elegir el método que es el más apropiado: Esto no tiene que ver con la construcción de combinaciones lineales, sino simplemente en la forma en que desea interpretar el resultado factorial espacio.

Referencias

  1. Harman, H. H. (1976). Moderno Factor De Análisis. Chicago, University of Chicago Press.
  2. Cattell, R. B. (1978). El Uso Científico del Análisis factorial. Nueva York, Plenum.
  3. Kline, P. (1991). De inteligencia. El Psicométricas De La Vista. Routledge.

4voto

Eric Davis Puntos 1542

Puntos Básicos

  • La rotación puede facilitar la interpretación de los componentes más clara
  • Rotación oblicua a menudo tiene más sentido teórico. I. e., Las variables observadas puede ser explicado en términos de un número menor de correlación de los componentes.

Ejemplo

  • 10 pruebas de todos los de medición de capacidad con un poco de medición verbal y algunos de medición de la capacidad espacial. Todas las pruebas están interrelacionadas, pero intercorrelaciones dentro verbal o en pruebas espaciales son mayores que en todo tipo de prueba. Un parsimonioso de la PCA puede hacer que dos correlación de los componentes, verbal y espacial. La teoría y la investigación sugiere que estas dos habilidades son correlacionados. Por lo tanto, una rotación oblicua hace sentido teórico.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X