Factor de análisis es esencialmente un (limitado) modelo de regresión lineal. En este modelo, cada uno analizó la variable es la variable dependiente, los factores comunes son los IVs, y la implícita único factor de servir como el término de error. (El término constante es cero debido a centrar o estandarización de los que están implícitas en el cálculo de las covarianzas o correlaciones.) Así que, exactamente igual que en la regresión lineal, no podría existir "fuerte" suposición de normalidad - IVs (factores comunes) son multivariante normal y errores (único factor) son normales, lo que automáticamente conduce a que el DV es normal; y a los "débiles" suposición de normalidad de errores (único factor) son normales solamente, por lo tanto la DV no tiene que ser normal. Tanto en la regresión y la FA nos suelen admitir "débil" asunción, porque es más realista.
Entre los clásicos de la FA métodos de extracción de sólo el método de máxima verosimilitud, ya que se aparta de las características de la población, los estados que las variables analizadas ser normal multivariante. Métodos como los ejes principales de la mínima o residuos no requieren de este "fuerte" de la asunción (aunque se puede hacer de todos modos).
Por favor, recuerde que incluso si las variables son normales por separado, no necesariamente garantiza que sus datos son multivariante normal.
Vamos a aceptar "débil" suposición de normalidad. ¿Cuál es el potencial amenaza procedente de fuertemente sesgada de datos, como tu, entonces? Es de los valores atípicos. Si la distribución de una variable es fuertemente asimétrica de la cola más larga se convierte en extra influyentes en el cómputo de las correlaciones o covarianzas, y al mismo tiempo provoca aprensión acerca de si se mide el mismo constructo psicológico (el factor) como la cola mas corta. Podría ser cautelosos a la hora de comparar si las matrices de correlación construido en la mitad inferior y la mitad superior de la escala de calificación son similares o no. Si son lo suficientemente similares, se puede concluir que los dos colas medir la misma cosa y no transformar las variables. De lo contrario, usted debería considerar la posibilidad de transformar o alguna otra acción para neutralizar el efecto de "atípico" de cola larga.
Las transformaciones son un montón. Por ejemplo, elevar a una potencia>1 o exponenciación se utilizan para la izquierda sesgada de los datos y de alimentación<1 o logaritmo - para sesgada de derecha. Mi propia experiencia dice que los llamados transformación óptima a través de Categórico de la PCA a cabo antes de la FA es casi siempre beneficioso, por lo general conduce a la más clara, interpretables factores en FA; bajo el supuesto de que el número de factores es conocida, se transforma tus datos de una forma no lineal con el fin de maximizar el total de varianza explicada por varios factores.