Tengo el siguiente conjunto de datos: hemos medido la temperatura 1000 veces en 9 estaciones diferentes de todo el país. Los datos están representados en una matriz con 9 filas y 1000 columnas. Escribí mi propia implementación de PCA y tengo que reducir la dimensionalidad a 3. Lo hice y funciona pero no entiendo algunas cosas.
En primer lugar, algo de terminología. En la wikipedia he leído que los términos variable y observación se suelen utilizar. En mi caso, las observaciones serían los valores de temperatura y las variables las 9 estaciones?
¿Por qué tengo que tomar la transposición de la matriz, obteniendo un $1000\times 9$ matriz, antes de hacer el PCA?
Básicamente lo que tengo que hacer es intentar mantener la información del conjunto de datos original utilizando únicamente los valores de temperatura de $3$ de $9$ ¿Estaciones?