Tras leer sobre ambos algoritmos (el análisis de componentes principales y el análisis discriminante lineal), empecé a utilizarlos combinados de una forma que me pareció intuitiva.
Tengo un conjunto de datos que proyecto en 3D utilizando PCA A continuación, agrupo los datos proyectados (por ejemplo, utilizando la agrupación de k-means) y tomo el grupo más grande como mi conjunto de datos válido y el resto se considera como valores atípicos. A continuación, utilizo LDA para proyectar mis datos originales válidos (no los proyectados por el PCA) en un espacio en el que la separación entre clases sea máxima. Este modelo se utiliza luego para clasificar los nuevos datos de entrada. Puede que también necesite mantener el modelo PCA para filtrar los nuevos datos de entrada, pero esto es otro tema.
Mi pregunta es: ¿Es correcto utilizar estos algoritmos de esta manera? ¿O sugeriría usted un enfoque diferente?