Si he entendido bien, un Análisis Discriminante Lineal (LDA) asume datos con distribución normal, características independientes y covarianzas idénticas para cada clase para el criterio de optimalidad.
Dado que la media y la varianza se estiman a partir de los datos de entrenamiento, ¿no es ya una violación?
He encontrado una cita en un artículo (Li, Tao, Shenghuo Zhu y Mitsunori Ogihara. " Uso del análisis discriminante para la clasificación multiclase: Una investigación experimental ." Knowledge and Information Systems 10, no. 4 (2006): 453-72. )
"El análisis discriminante lineal consigue con frecuencia buenos resultados en tareas de reconocimiento de caras y objetos, a pesar de que las suposiciones de una matriz de covarianza común entre los grupos y la normalidad son a menudo normalidad (Duda, et al., 2001)".
-- desgraciadamente, no he podido encontrar la sección correspondiente en Duda et. al. "Pattern Classification".
¿Alguna experiencia o idea sobre el uso de LDA (frente a LDA regularizado o QDA) para datos no normales en el contexto de la reducción de la dimensionalidad?
1 votos
Usted pregunta específicamente por el LDA multiclase. ¿Qué le hace pensar que el LDA multiclase y el LDA biclase se comportan de forma diferente en este sentido (bajo la violación de los supuestos de normalidad y/o covarianza común)?
0 votos
Si no me estoy perdiendo algo aquí, debería basarse en los mismos supuestos, ¿no? Es que no he visto ningún supuesto en el artículo de Rao con respecto a la normalidad, pero he generalizado la pregunta