26 votos

Propiedades del ACP para observaciones dependientes

Solemos utilizar el ACP como técnica de reducción de la dimensionalidad para datos en los que se supone que los casos son i.i.d.

Pregunta: ¿Cuáles son los matices típicos en la aplicación de PCA para datos dependientes, no i.i.d.? ¿Qué propiedades agradables/útiles del ACP que se mantienen para los datos i.i.d. se ven comprometidas (o se pierden por completo)?

Por ejemplo, los datos podrían ser series temporales multivariantes, en cuyo caso cabría esperar autocorrelación o heteroscedasticidad condicional autorregresiva (ARCH).

Ya se han planteado anteriormente varias preguntas relacionadas sobre la aplicación del ACP a los datos de series temporales, por ejemplo 1 , 2 , 3 , 4 pero busco una respuesta más general y exhaustiva (sin necesidad de extenderme mucho en cada punto concreto).

Edita: Como señala @ttnphns, PCA sí mismo no es un análisis inferencial. Sin embargo, uno podría estar interesado en el rendimiento de generalización del ACP, es decir, centrarse en la contrapartida poblacional del ACP muestral. Por ejemplo, como se indica en Nadler (2008) :

Suponiendo que los datos dados sean una muestra finita y aleatoria de una distribución (generalmente desconocida), una cuestión teórica y práctica interesante es la relación entre los resultados del ACP muestral calculados a partir de datos finitos y los del modelo de población subyacente.

Referencias:

1voto

que que Puntos 1435

Es de suponer que podría añadir el componente temporal como una característica adicional a los puntos muestreados, y ahora son i.i.d.? Básicamente, los puntos de datos originales están condicionados por el tiempo:

$$ p(\mathbf{x}_i \mid t_i) \ne p(\mathbf{x}_i) $$

Pero, si definimos $\mathbf{x}_i' = \{\mathbf{x}_i, t_i\}$ entonces tenemos:

$$ p(\mathbf{x}'_i \mid t_i) = p(\mathbf{x}'_i) $$

... y las muestras de datos son ahora mutuamente independientes.

En la práctica, al incluir el tiempo como una característica en cada punto de datos, PCA podría tener como resultado que un componente simplemente apunte a lo largo del eje de la característica temporal. Pero si alguna característica está correlacionada con la característica temporal, un componente podría consistir en una o más de estas características, así como la característica temporal.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X