9 votos

Variables asimétricas en el ACP o el análisis factorial

Quiero hacer un análisis de componentes principales (análisis factorial) en SPSS basado en 22 variables. Sin embargo, algunas de mis variables están muy sesgadas (la asimetría calculada en el SPSS oscila entre 2 y 80).

Así que aquí están mis preguntas:

  1. ¿Debo mantener las variables sesgadas así o puedo transformar las variables en un análisis de componentes principales? En caso afirmativo, ¿cómo interpretaría las puntuaciones de los factores?

  2. ¿Qué tipo de transformación debo hacer? ¿Log10 o ln?

  3. Originalmente, mi KMO (Kaiser-Meyer-Olkin) es de 0,413. Mucha literatura recomienda un mínimo de 0,5. ¿Puedo seguir haciendo el análisis factorial o tengo que eliminar variables para elevar mi KMO a 0,5?

7 votos

Una nota: PCA no es lo mismo que el análisis factorial. El ACP es un método de reducción de datos, el AF es un intento de encontrar variables latentes. A menudo (pero no siempre) dan resultados similares

10voto

Uri Puntos 111
  1. El problema de la asimetría en el ACP es el mismo que en la regresión: la cola más larga, si es realmente larga en relación con todo el rango de la de la distribución, se comporta como un gran valor atípico que atrae la línea de ajuste (componente principal en su caso) fuertemente hacia sí misma porque su influencia es mayor; su influencia es mayor porque está tan lejos de la media. En el contexto del ACP, permitir variables muy sesgadas es bastante similar a hacer PCA sin centrar los datos (es decir, hacer PCA sobre la base de la matriz de coseno en lugar de la matriz de correlación). Es usted que decide si se debe permitir que la larga cola influya tanto en los resultados (y dejar que los datos) o no (y transformar los datos). La cuestión no está relacionada con la forma de interpretar las cargas.

  2. Como quieras.

  3. El KMO es un índice que indica si las correlaciones parciales correlaciones son razonablemente pequeñas para someter los datos al análisis factorial. Porque en el análisis factorial generalmente esperamos que un factor cargue más que sólo dos variables. Su KMO es lo suficientemente bajo. Puede mejorarlo puede mejorar si elimina del análisis las variables con valores KMO individuales bajos valores KMO bajos (estos forman la diagonal de antiimagen matriz, puede solicitar que se muestre esta matriz en el procedimiento SPSS Factor). ¿Puede transformar las variables en menos asimétricas recuperar el KMO? Quién sabe. Tal vez. Tenga en cuenta que el KMO es importante sobre todo en el modelo de análisis factorial, no en el modelo de análisis de componentes principales: en el AF se ajustan las correlaciones correlaciones por pares, mientras que en el PCA no.

2voto

Sean Hanley Puntos 2428

+1 a @ttnphns, sólo quiero ampliar un poco el punto #2. Las transformaciones se utilizan a menudo para estabilizar la inclinación. Como señala @ttnphns, se usarían estas antes de que se ejecutan los análisis. Las transformaciones logarítmicas forman parte del Familia de transformaciones de potencia Box-Cox . Conviene considerar una gama más amplia de posibles transformaciones que sólo los logaritmos (por ejemplo, raíz cuadrada, recíproca, etc.). La elección entre diferentes bases logarítmicas no afecta a la fuerza de la transformación. Cuando la gente va a trabajar matemáticamente con la variable transformada, a veces se prefieren los logaritmos naturales, ya que el logaritmo natural puede hacer que las matemáticas sean más limpias en algunos casos. Si no le importa eso, puede elegir una base que facilite la interpretación. Es decir, cada aumento de la unidad en la nueva escala representará un base -superación de la escala original (por ejemplo, si se utiliza el logaritmo de base 2, entonces cada unidad sería una superación de 2 veces, la base 10 significa que cada unidad sería una superación de 10 veces, etc.), por lo que puede ser bueno elegir una base tal que sus datos abarquen varias unidades en la escala transformada.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X