Estoy experimentando con el algoritmo de eigenfaces, y no tengo claros algunos de los puntos más finos de la técnica. Para empezar, considere la matriz de imágenes utilizada para hacer el ACP inicial. ¿Es "mejor" tener sólo imágenes de diferentes individuos en esa matriz? ¿O es útil incluir varias imágenes del mismo individuo?
Algunas de las implementaciones de demostración que he visto parecen utilizar sólo una imagen por individuo. Otras utilizan más de una (y, por lo general, éstas parecen tener N imágenes de muestra por individuo en lugar de variar el tamaño de las muestras). El documento que describe el algoritmo parece sugerir que las imágenes múltiples podrían producir resultados más precisos.
Intuitivamente, parece que las imágenes múltiples de una misma persona tenderían a debilitar los resultados del PCA. Por ejemplo, si tuviera 100 imágenes en las que 90 fueran de la misma persona, los componentes principales se centrarían más en distinguir entre esas 90 imágenes de la misma persona que en distinguirla de los otros 10 individuos. ¿No es así?
¿Se sigue aplicando el mismo razonamiento cuando hay un número uniforme de imágenes de muestra por individuo? Si no es así, ¿hay alguna directriz sobre cómo equilibrar el número de muestras por individuo con el número total de imágenes de entrenamiento?