7 votos

¿Qué es un "factor" en el análisis de factores?

¿Qué es un factor desde el punto de vista del álgebra lineal? ¿Es un vector, una matriz, una base, una tupla, un sistema de coordenadas o algo más?

3 votos

¿Cuál es su conocimiento actual al respecto desde el punto de vista de los estudiantes?

0 votos

Ttnphns, ¿vector?

4voto

jlo Puntos 755

El modelo habitual de análisis factorial es

$$\mathbf{Y} = \mathbf{\mu}+ \mathbf{\Phi}\mathbf{L} + \mathbf{\eta},$$

donde $\mathbf{Y}$ representa una colección de $n$ observaciones de $k$ variables aleatorias; es decir, es una matriz de $n \times k$ tamaño. $\mathbf{\mu} = \mathbf{1}_n^{\prime} (\mu_1, \mu_2, \ldots, \mu_k)$ también es un $n\times k$ matriz, constante en cada columna, dando la media de las $k$ variables. $\mathbf{\Phi}$ es un $n\times p$ matriz de $p \le k$ factores; $\mathbf{L}$ es un $p \times n$ matriz de (desconocido) constantes (por estimar); y $\mathbf{\eta}$ es un $n \times k$ matriz de errores. Las filas de $\mathbf{\eta}$ son independientes y no dependen de $\Phi$ . Los elementos de la fila $i$ tienen medios $0$ y la varianza $\sigma_i^2$ . Las cantidades del lado derecho son inobservables pero (normalmente) menos numerosas que las $nk$ valores de datos, por lo que son (hasta un grado de ambigüedad que se discute más adelante) identificable . Tenga en cuenta que $\eta$ no debe identificarse, sino sólo sus variantes de fila $\sigma_i^2$ , llamadas "unicidades".

En el lenguaje del análisis factorial, el factores son las columnas de $\mathbf{\Phi}$ . Desde $k$ variables originales que extrae $p\lt k$ factores. Se puede decir que un "factor" es una columna completa, es decir, un conjunto de $n$ realizaciones de una variable aleatoria o, más abstractamente, una variable aleatoria en sí misma. Normalmente se supone que los factores no están correlacionados y están estandarizados, es decir, que tienen varianza unitaria.

Las filas de $\mathbf{L}$ se llaman cargas factoriales .

Obsérvese que este modelo es único sólo hasta las transformaciones ortogonales, ya que $$\mathbf{Y} = \mathbf{\mu}+ (\mathbf{\Phi P^\top})(\mathbf{PL}) + \mathbf{\eta},$$ donde $\mathbf{P}$ es cualquier matriz ortogonal.

0 votos

@whuber: Bueno, considerémoslo con precisión. Por supuesto que estoy de acuerdo en que la matriz $Y$ puede definirse como $n\times k$ . Así que esta respuesta dice que $L$ son las cargas de los factores y es $n\times k$ y $\Phi$ son factores y es $k\times k$ . ¿Puedes mostrarme en la wikipedia a qué corresponde esto? Wikipedia llama a la matriz de datos $Z$ y tiene el mismo tamaño que $Y$ . Bien. Entonces dice que es igual a $LF$ (hasta el ruido y una constante), donde las cargas $L$ son $n\times p$ y $F$ es $p \times k$ . ¿Ves la diferencia? Por supuesto. $F=\Phi$ no puede ser ni cuadrado ni diagonal, como afirma Dennis.

0 votos

@whuber: Parece que en mi primer comentario introduje alguna confusión más, así que lo he borrado ahora. Dado que Dennis no aparecía por aquí desde septiembre, me pregunto si debemos editar su respuesta para que sea correcta. Parece que es fácil de hacer.

0 votos

@amoeba Tienes razón. Comparar esto con la Wikipedia es confuso por cómo transpone lo habitual (casos $\times$ variables) matriz, pero una inspección minuciosa indica que esta respuesta no está de acuerdo. Para ser justos contigo, ¿por qué no invertimos nuestros papeles? Intentaré arreglar la respuesta y tú podrás aportar una crítica útil :-).

-1voto

Aksakal Puntos 11351

El factor es un vector. El conjunto de factores le da un sistema de coordenadas, una base. Las cargas de los factores son conjuntos de coordenadas en esta base.

Digamos que tienes un $T\times n$ matriz $X=x_{ti}$ . Imagina que es una trayectoria de la partícula en un espacio n-dimensional, donde $t$ es el tiempo, y $i$ es la dimensión.

Lo que hace el análisis factorial es simplemente cambiar el sistema de coordenadas de su base actual a otra cosa, entonces su $X$ se convierte en una matriz $T\times n$ matriz $A=a_{ti}$ . Es el mismo camino en el tiempo, excepto en coordenadas diferentes. Las coordenadas reales de un punto en el tiempo $t$ se llaman cargas o una puntuación en PCA, es decir, cada fila es un punto concreto en el tiempo, una carga.

La razón para transformar las coordenadas suele ser la comodidad o la claridad. Por ejemplo, serían coordenadas de movimiento circular en sistema cartesiano (x,y):

    0.8415    0.5403
    0.9093   -0.4161
    0.1411   -0.9900
   -0.7568   -0.6536
   -0.9589    0.2837
   -0.2794    0.9602
    0.6570    0.7539
    0.9894   -0.1455
    0.4121   -0.9111
   -0.5440   -0.8391

Aquí está lo mismo en sistema polar (ángulo, radio):

1.0000    1.0000
2.0000    1.0000
3.0000    1.0000
4.0000    1.0000
5.0000    1.0000
6.0000    1.0000
0.7168    1.0000
1.7168    1.0000
2.7168    1.0000
3.7168    1.0000

Obviamente, el sistema polar es más adecuado para este proceso, ya que se puede reducir la dimensionalidad del sistema. Es esencialmente un movimiento unidimensional a lo largo de la circunferencia del círculo.

El análisis factorial suele ser lineal de alguna manera, y no hace cosas geniales como ésta, pero sigue funcionando para muchos procesos.

2 votos

Literalmente cualquier cosa en matemáticas puede considerarse un vector. Por lo tanto, para proporcionar cualquier información significativa, es necesario describir el espacio vectorial y lo que representa. Al menos danos una pista sobre su dimensión.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X