He encontrado este blog donde el autor entrena un modelo de Asignación de Dirichlet Latente (LDA) en 20 grupos de noticias. El resultado es un $N\times K$ matriz donde $N$ es el número de artículos (por fila) y $K$ es el número de temas (por columnas), es decir, cada fila es una distribución discreta de temas.
A continuación, el autor utiliza t-SNE para reducir la dimensionalidad de la matriz de $K$ a 2 dimensiones para poder visualizar las agrupaciones de documentos por temas. Las agrupaciones de documentos del resultado de t-SNE parecen incluso tener sentido.
Mi pregunta es, ¿es razonable hacer esto? LDA produce una distribución discreta sobre los temas para cada documento. t-SNE reduce la dimensionalidad de los vectores / puntos en un espacio de alta dimensión para visualizar la estructura local. Como la salida de LDA es una distribución, pensé que sería de alguna manera incorrecto hacer esto? Entiendo que la distribución, al ser discreta, puede pensarse como un punto en el $K$ espacio dimensional. Pero el uso de t-SNE para visualizar una salida discreta parece de alguna manera incorrecto. ¿Me estoy perdiendo algo?
EDIT: La métrica que el autor utiliza en t-SNE es la distancia euclidiana - por eso estoy confundido, porque el autor está utilizando la distancia euclidiana para comparar distribuciones.