9 votos

¿Son las transformaciones de datos datos no normales para un análisis factorial exploratorio cuando se utiliza el método de extracción factorización del eje principal?

Estoy desarrollando un cuestionario para medir los cuatro factores que constituyen la espiritualidad, y me gustaría hacer la siguiente pregunta:

Son transformaciones de datos en la no-normalidad de los datos necesarios para un análisis factorial exploratorio cuando se utiliza el eje principal de factoring método de extracción?

Terminé de detección de los datos de mi ayer, y he encontrado que el 3 de 20 preguntas están positivamente sesgada, mientras que 1 de cada 20 es negativamente sesgada (Pregunta 6 = 4.88, la Pregunta 9 = 7.22, la Pregunta 12 = 11.11, la Pregunta 16 = -6.26). Yo también encontró que 1 de las preguntas (de 20) es leptokurtic (Pregunta 12 = 12.21).

Elegí el eje principal de factoring método de extracción porque he leído que es usada en "severamente no normal de los datos", mientras que el de máxima probabilidad se utiliza en la normal de datos, pero:

  1. Cómo puedo saber si mis datos están "gravemente" no normales?

  2. Si mis datos son "rigurosamente no-normal", ¿eso significa que puedo dejar los datos como lo es ahora (no para transformarla) y analizar el uso el eje principal de factoring método de extracción? O tengo que transformar los datos antes de proceder con la EPT?

  3. Si me es necesario transformar los datos, ¿qué transformaciones se usaría para positivamente sesgada negativamente sesgada, y leptokurtic elementos?

11voto

Uri Puntos 111

Factor de análisis es esencialmente un (limitado) modelo de regresión lineal. En este modelo, cada uno analizó la variable es la variable dependiente, los factores comunes son los IVs, y la implícita único factor de servir como el término de error. (El término constante es cero debido a centrar o estandarización de los que están implícitas en el cálculo de las covarianzas o correlaciones.) Así que, exactamente igual que en la regresión lineal, no podría existir "fuerte" suposición de normalidad - IVs (factores comunes) son multivariante normal y errores (único factor) son normales, lo que automáticamente conduce a que el DV es normal; y a los "débiles" suposición de normalidad de errores (único factor) son normales solamente, por lo tanto la DV no tiene que ser normal. Tanto en la regresión y la FA nos suelen admitir "débil" asunción, porque es más realista.

Entre los clásicos de la FA métodos de extracción de sólo el método de máxima verosimilitud, ya que se aparta de las características de la población, los estados que las variables analizadas ser normal multivariante. Métodos como los ejes principales de la mínima o residuos no requieren de este "fuerte" de la asunción (aunque se puede hacer de todos modos).

Por favor, recuerde que incluso si las variables son normales por separado, no necesariamente garantiza que sus datos son multivariante normal.

Vamos a aceptar "débil" suposición de normalidad. ¿Cuál es el potencial amenaza procedente de fuertemente sesgada de datos, como tu, entonces? Es de los valores atípicos. Si la distribución de una variable es fuertemente asimétrica de la cola más larga se convierte en extra influyentes en el cómputo de las correlaciones o covarianzas, y al mismo tiempo provoca aprensión acerca de si se mide el mismo constructo psicológico (el factor) como la cola mas corta. Podría ser cautelosos a la hora de comparar si las matrices de correlación construido en la mitad inferior y la mitad superior de la escala de calificación son similares o no. Si son lo suficientemente similares, se puede concluir que los dos colas medir la misma cosa y no transformar las variables. De lo contrario, usted debería considerar la posibilidad de transformar o alguna otra acción para neutralizar el efecto de "atípico" de cola larga.

Las transformaciones son un montón. Por ejemplo, elevar a una potencia>1 o exponenciación se utilizan para la izquierda sesgada de los datos y de alimentación<1 o logaritmo - para sesgada de derecha. Mi propia experiencia dice que los llamados transformación óptima a través de Categórico de la PCA a cabo antes de la FA es casi siempre beneficioso, por lo general conduce a la más clara, interpretables factores en FA; bajo el supuesto de que el número de factores es conocida, se transforma tus datos de una forma no lineal con el fin de maximizar el total de varianza explicada por varios factores.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X