Además de las respuestas que ya se centran en las propiedades matemáticas, me gustaría comentar desde un punto de vista experimental.
Resumen: la generación de datos de los procesos se han optimizado de una manera que hace que los datos sean adecuados para los componentes principales (PCR) o mínimos cuadrados parciales (PLS) de regresión.
Soy químico analítico. Cuando me diseñar un experimento/método para medir (regresión o clasificación) de algo, yo uso mis conocimientos sobre la aplicación y los instrumentos disponibles para obtener datos que lleva una buena relación señal a ruido con respecto a la tarea a mano. Eso significa que, de los datos que generan está diseñado para tener grandes covarianza con la propiedad de interés.
Esto conduce a una variación de la estructura donde el interesante la varianza es grande, y más tarde el Pc va a llevar a la (pequeña) solo ruido.
También me gustaría prefieren los métodos que producen redundante la información acerca de la tarea a la mano, con el fin de tener más robusto o resultados más precisos. PCA se concentra redundante canales de medición a un PC, que a su vez lleva parte de la varianza y es por lo tanto uno de los primeros Ordenadores personales.
Si se conocen los factores de confusión que llevará a la gran variación que no se correlaciona con la propiedad de interés, te suelen tratar de corregir estos tanto como sea posible durante el preprocesamiento de los datos: en muchos casos, estos factores de confusión son de una conocida de la física o la química de la naturaleza, y este conocimiento se sugiere maneras apropiadas para corregir los factores de confusión. E. g. Yo medida de espectros Raman bajo el microscopio. Su intensidad depende de la intensidad de la luz del láser, así como en lo bien que me puede enfocar el microscopio. Ambos conducen a cambios que pueden ser corregidos por la normalización por ejemplo, para una señal de que es conocido por ser constante.
Por lo tanto, los grandes contribuyentes de la varianza, que no contribuye a la solución pueden haber sido eliminados antes de que los datos entra en PCA, dejando en su mayoría significativa de la varianza en los primeros PCs.
Por último, pero no menos importante, hay un poco de una profecía autocumplida aquí: Obviamente PCR se realiza con los datos de donde la suposición de que la información de la realización de la varianza es grande, tiene sentido. Si, por ejemplo, creo que no podrían ser importantes factores de confusión que no sé cómo corregir, me gustaría ir inmediatamente para PLS que es mejor ignorar las grandes contribuciones que no ayudan con la tarea de predicción.