Soy consciente de la estupidez de esta pregunta, pero escúchame.
Imaginemos una regresión lineal (por ejemplo, OLS) en la que realizamos PCA en todas nuestras variables independientes y utilizamos todos los componentes principales resultantes (por tanto, número de componentes principales = número de variables independientes) como variables independientes. A primera vista, parece que esto rectificará cualquier problema de multicolinealidad por grave que sea (ya que todos los componentes principales son ortogonales). Además, no tendremos ningún problema para interpretar los coeficientes resultantes, ya que se pueden proyectar de nuevo en el espacio de coeficientes original sin pérdida de identidad (ya que el número de componentes principales que utilizamos = número de variables independientes) simplemente tomando un producto con componentes principales. Así pues, todos salimos ganando.
Es evidente que algo falla en este planteamiento. Simplemente no consigo encontrar un marco para analizar esta situación correctamente. Cualquier ayuda es apreciada.
EDITAR:
Para poner la pregunta en perspectiva, imagine que le encargan construir un modelo OLS. Hay dos variables independientes muy colineales. Por lo general, se omite una de ellas o se realiza un ACP y se utiliza el primer componente principal como predictor. Sin embargo, la persona que le encargó la construcción del modelo está interesada en estimar los coeficientes de ambas variables, por lo que las opciones anteriores no están disponibles. Además, esta persona quiere que el modelo cumpla ciertos criterios formales, uno de los cuales es un VIF por debajo de cierto umbral, lo que no es posible si incluye las dos variables independientes altamente colineales tal cual. Por lo tanto, la única opción que nos queda es utilizar el ACP sobre estas dos variables y utilizar los dos componentes principales resultantes como predictores, lo que nos permite obtener coeficientes sobre ambas en el espacio de coeficientes original (multiplicando los coeficientes de los componentes principales y de los propios componentes principales) y pasar el umbral VIF. La persona que le encargó construir el modelo está perfectamente de acuerdo con este enfoque, pero no puedo evitar tener la sensación de que algo falla. ¿Estamos simplemente enmascarando el problema de la multicolinealidad aquí para engañar a la métrica VIF?