¿Cuál es la razón, si es que la hay, para utilizar el Análisis Discriminatorio (DA) en los resultados de un algoritmo de agrupación como el k-means, tal y como lo veo de vez en cuando en la literatura (esencialmente en la subtipificación clínica de los trastornos mentales)?
Generalmente no se recomienda probar las diferencias de grupo en las variables que se utilizaron durante la construcción del grupo, ya que apoyan la maximización (o minimización) de la inercia entre las clases (o dentro de las clases). Por lo tanto, no estoy seguro de apreciar plenamente el valor añadido del DA predictivo, a menos que busquemos incrustar a los individuos en un espacio factorial de menor dimensión y nos hagamos una idea de la "generalizabilidad" de tal partición. Pero incluso en este caso, el análisis de conglomerados sigue siendo fundamentalmente una herramienta exploratoria, por lo que utilizar la pertenencia a una clase computada de esta manera para derivar una regla de puntuación parece extraño a primera vista.
¿Alguna recomendación, idea o indicación sobre los documentos pertinentes?